Ի՞նչ է կայքի ինդեքսավորումը: Ինչպե՞ս է դա տեղի ունենում: Այս և այլ հարցերի պատասխանները կարող եք գտնել հոդվածում: Վեբ ինդեքսավորումը (ինդեքսավորումը որոնման համակարգերում) որոնման ռոբոտի կողմից տվյալների բազայում կայքի մասին տեղեկատվության ավելացման գործընթացն է, որն այնուհետև օգտագործվում է նման ընթացակարգ անցած վեբ նախագծերի վերաբերյալ տեղեկատվություն փնտրելու համար:
Վեբ ռեսուրսների մասին տվյալները ամենից հաճախ բաղկացած են հիմնաբառերից, հոդվածներից, հղումներից, փաստաթղթերից: Աուդիո, պատկերներ և այլն կարող են նաև ինդեքսավորվել: Հայտնի է, որ հիմնաբառերի հայտնաբերման ալգորիթմը կախված է որոնման համակարգից։
Կա որոշ սահմանափակումներ ինդեքսավորված տեղեկատվության տեսակների վերաբերյալ (flash ֆայլեր, javascript):
Նախաձեռնման կառավարում
Կայքի ինդեքսավորումը բարդ գործընթաց է: Այն կառավարելու համար (օրինակ՝ որոշակի էջի կցումն արգելելու համար), դուք պետք է օգտագործեք robots.txt ֆայլը և այնպիսի հրահանգներ, ինչպիսիք են Allow, Disallow, Crawl-delay, User-agent և այլն:
Նաև պիտակները և հենակետերն օգտագործվում են ինդեքսավորման համար՝ թաքցնելով ռեսուրսի բովանդակությունը Google-ից և Yandex ռոբոտներից (Yahoo-ն օգտագործում է պիտակը):
Goglle որոնողական համակարգում նոր կայքերը ինդեքսավորվում են մի քանի օրից մինչև մեկ շաբաթ, իսկ Yandex-ում՝ մեկից չորս շաբաթ:
Ցանկանու՞մ եք, որ ձեր կայքը հայտնվի որոնման համակարգի արդյունքների հարցումներում: Այնուհետև այն պետք է մշակվի Rambler, Yandex, Google, Yahoo և այլն: Դուք պետք է որոնողական համակարգերին (սարդեր, համակարգեր) տեղեկացնեք ձեր կայքի գոյության մասին, այնուհետև նրանք ամբողջությամբ կամ մասամբ կսողան այն։
Շատ կայքեր տարիներ շարունակ չեն ինդեքսավորվել: Նրանց վրա եղած տեղեկատվությունը ոչ ոք չի տեսնում, բացի նրանց տերերից:
մշակման մեթոդներ
Կայքի ինդեքսավորումը կարող է իրականացվել մի քանի եղանակով.
- Առաջին տարբերակը ձեռքով ավելացումն է: Դուք պետք է մուտքագրեք ձեր կայքի տվյալները որոնման համակարգերի կողմից առաջարկվող հատուկ ձևերի միջոցով:
- Երկրորդ դեպքում որոնիչ ռոբոտն ինքն է գտնում ձեր վեբ կայքը հղումներով և ինդեքսավորում այն: Նա կարող է գտնել ձեր կայքը այլ ռեսուրսների հղումներով, որոնք տանում են դեպի ձեր նախագիծը: Այս մեթոդը ամենաարդյունավետն է: Եթե որոնիչն այս կերպ գտնում է կայք, ապա այն համարում է նշանակալի։
Ժամկետ
Կայքի ինդեքսավորումն այնքան էլ արագ չէ: Ժամկետները տարբեր են՝ 1-2 շաբաթ։ Հեղինակավոր ռեսուրսների հղումները (գերազանց PR-ով և Titz-ով) զգալիորեն արագացնում են կայքի տեղաբաշխումը որոնման համակարգի տվյալների բազայում։ Այսօր Google-ը համարվում է ամենադանդաղը, թեև մինչև 2012 թվականը կարող էր այս աշխատանքը կատարել մեկ շաբաթում։ ԴեպիՑավոք սրտի, ամեն ինչ շատ արագ է փոխվում։ Հայտնի է, որ Mail.ru-ն աշխատում է այս ոլորտի կայքերի հետ շուրջ վեց ամիս։
Կայքի ինդեքսավորումը որոնման համակարգերում հնարավոր չէ յուրաքանչյուր մասնագետի համար։ Որոնողական համակարգերի կողմից արդեն մշակված կայքի տվյալների բազայում նոր էջեր ավելացնելու ժամանակի վրա ազդում է դրա բովանդակության թարմացման հաճախականությունը: Եթե ռեսուրսի վրա անընդհատ թարմ տեղեկատվություն է հայտնվում, համակարգը համարում է այն հաճախ թարմացվող և օգտակար մարդկանց համար: Այս դեպքում նրա աշխատանքը արագացված է։
Դուք կարող եք հետևել վեբ կայքի ինդեքսավորման առաջընթացին վեբ վարպետների հատուկ բաժիններում կամ որոնողական համակարգերում:
Փոփոխություններ
Այսպիսով, մենք արդեն պարզել ենք, թե ինչպես է կայքը ինդեքսավորվում: Հարկ է նշել, որ որոնման համակարգերի տվյալների բազաները հաճախ թարմացվում են: Հետևաբար, դրանցում ավելացված ձեր նախագծի էջերի քանակը կարող է փոխվել (և նվազել, և աճել) հետևյալ պատճառներով՝
- որոնողական համակարգի պատժամիջոցներ կայքի նկատմամբ;
- կայքում սխալների առկայությունը;
- փոփոխելով որոնման ալգորիթմները;
- զզվելի հոսթինգ (սերվերի անհասանելիություն, որտեղ գտնվում է նախագիծը) և այլն:
Yandex-ի պատասխանները սովորական հարցերի
«Yandex»-ը որոնողական համակարգ է, որն օգտագործվում է բազմաթիվ օգտատերերի կողմից: Համաշխարհային որոնման համակարգերի շարքում այն զբաղեցնում է հինգերորդ տեղը՝ մշակված հետազոտական հարցումների քանակով։ Եթե դրանում կայք եք ավելացրել, տվյալների բազայում ավելացնելը կարող է շատ երկար տևել:
URL-ի ավելացումը չի երաշխավորում դրա ինդեքսավորումը: Սա միայն այն մեթոդներից մեկն է, որով ասվում է համակարգի ռոբոտընոր ռեսուրսի մասին։ Եթե այլ կայքերից մի կայք հղումներ քիչ կան կամ չկան, ապա դրա ավելացումը կօգնի ձեզ ավելի արագ գտնել այն:
Եթե ինդեքսավորումը տեղի չի ունեցել, դուք պետք է ստուգեք, թե արդյոք սերվերի վրա անսարքություններ են եղել Yandex ռոբոտից դրա համար հավելված ստեղծելու պահին: Եթե սերվերը հաղորդում է սխալի մասին, ապա ռոբոտը կդադարեցնի իր աշխատանքը և կփորձի այն ավարտել շրջանաձև ճանապարհով: Yandex-ի աշխատակիցները չեն կարող մեծացնել որոնման համակարգի տվյալների բազայում էջեր ավելացնելու արագությունը։
Yandex-ում կայքի ինդեքսավորումը բավականին բարդ խնդիր է։ Դուք չգիտեք, թե ինչպես ավելացնել ռեսուրս որոնման համակարգում: Եթե դրան հղումներ կան այլ կայքերից, ապա ձեզ հարկավոր չէ հատուկ կայք ավելացնել՝ ռոբոտն ավտոմատ կերպով կգտնի այն և ինդեքսավորի այն: Եթե դուք նման հղումներ չունեք, կարող եք օգտագործել «Ավելացնել URL» ձևը՝ որոնման համակարգին հայտնելու, որ կայքը գոյություն ունի:
Հիշեք, որ URL ավելացնելը չի երաշխավորում, որ ձեր ստեղծագործությունը ինդեքսավորվի (կամ ինդեքսավորվի):
Շատերին հետաքրքրում է, թե որքան ժամանակ է պահանջվում Yandex-ում կայքը ինդեքսավորելու համար: Այս ընկերության աշխատակիցները երաշխիքներ չեն տալիս և ժամկետներ չեն կանխատեսում։ Որպես կանոն, քանի որ ռոբոտը իմացել է կայքի մասին, որոնման մեջ նրա էջերը հայտնվում են երկու օրից, երբեմն՝ մի քանի շաբաթից։
Գործընթաց
«Yandex»-ը որոնողական համակարգ է, որը պահանջում է ճշգրտություն և ուշադրություն: Կայքի ինդեքսավորումը բաղկացած է երեք մասից՝
- Որոնող ռոբոտը սողում է ռեսուրսների էջերը։
- Բովանդակությունկայքի (բովանդակությունը) գրանցվում է որոնման համակարգի տվյալների բազայում (ինդեքս):
- 2-4 շաբաթից տվյալների բազան թարմացնելուց հետո կարող եք տեսնել արդյունքները։ Ձեր կայքը կհայտնվի (կամ չի հայտնվի) որոնման արդյունքներում:
Ինդեքսի ստուգում
Ինչպե՞ս ստուգել կայքի ինդեքսավորումը: Դա անելու երեք եղանակ կա.
- Մուտքագրեք ձեր բիզնեսի անունը որոնման տողում (օրինակ՝ «Յանդեքս») և ստուգեք առաջին և երկրորդ էջերի բոլոր հղումները: Եթե այնտեղ գտնեք ձեր մտահղացման URL-ը, ուրեմն ռոբոտը կատարել է իր առաջադրանքը:
- Դուք կարող եք մուտքագրել ձեր կայքի URL-ը որոնման տողում: Դուք կկարողանաք տեսնել, թե քանի ինտերնետային թերթ է ցուցադրված, այսինքն՝ ինդեքսավորված։
- Գրանցվեք վեբ վարպետների էջերում Mail.ru-ում, Google-ում, Yandex-ում: Կայքի ստուգումն անցնելուց հետո դուք կկարողանաք տեսնել ինդեքսավորման արդյունքները և որոնման համակարգի այլ ծառայություններ, որոնք ստեղծվել են ձեր ռեսուրսի արդյունավետությունը բարելավելու համար:
Ինչու է Yandex-ը ձախողվում:
Google-ում կայքի ինդեքսավորումն իրականացվում է հետևյալ կերպ. ռոբոտը առանց ընտրելու մուտք է գործում կայքի բոլոր էջերը՝ ցածրորակ և բարձրորակ։ Բայց վարկանիշում ներառված են միայն օգտակար փաստաթղթեր։ Իսկ «Յանդեքս»-ը անմիջապես բացառում է բոլոր վեբ աղբը: Այն կարող է ինդեքսավորել ցանկացած էջ, բայց որոնիչն ի վերջո կվերացնի ամբողջ աղբը:
Երկու համակարգերն էլ ունեն աճող ինդեքս: Երկու ցածր որակի էջերն էլ ազդում են վեբ կայքի վարկանիշի վրա, որպես ամբողջություն: Այստեղ գործում է մի պարզ փիլիսոփայություն. Կոնկրետի սիրելի ռեսուրսներըօգտատերը իր թողարկման մեջ կզբաղեցնի ավելի բարձր դիրքեր: Բայց այս նույն անհատը դժվարությամբ կգտնի այնպիսի կայք, որն իրեն դուր չի եկել նախորդ անգամ:
Այդ իսկ պատճառով, նախ, անհրաժեշտ է ծածկել վեբ փաստաթղթերի պատճենները ինդեքսավորումից, ստուգել դատարկ էջերի առկայությունը և կանխել ցածրորակ բովանդակության ինդեքսավորումը:
Արագացրեք Yandex
Ինչպե՞ս կարող եմ արագացնել կայքի ինդեքսավորումը Yandex-ում: Հետևեք հետևյալ քայլերին.
- Տեղադրեք Yandex բրաուզերը ձեր համակարգչում և օգտագործեք այն կայքի էջերը թերթելու համար:
- Հաստատեք Yandex. Webmaster-ում ռեսուրսը կառավարելու իրավունքները։
- Հոդվածի հղումը տեղադրեք Twitter-ում: Հայտնի է, որ Yandex-ը այս ընկերության հետ համագործակցում է 2012 թվականից։
- Ավելացրեք որոնում Yandex-ից կայքի համար: «Ինդեքսավորում» բաժնում կարող եք մուտքագրել ձեր սեփական URL-ները:
- Մուտքագրեք «Yandex. Metrica» կոդը՝ առանց նշելու «Ինդեքսավորման համար էջեր ուղարկելն արգելված է»:
- Արտադրեք կայքի քարտեզ, որը գոյություն ունի միայն ռոբոտի համար և տեսանելի չէ հանդիսատեսին: Ստուգումը կսկսվի նրա հետ: Կայքի քարտեզի հասցեն մուտքագրվում է robots.txt կամ համապատասխան ձևով «Webmaster» - «Indexing Settings» - «Sitemap Files»:
միջանկյալ գործողություններ
Ի՞նչ է պետք անել, մինչև վեբ էջը ինդեքսավորվի Յանդեքսի կողմից: Ներքին որոնման համակարգը պետք է դիտարկի կայքը որպես առաջնային աղբյուր: Այդ իսկ պատճառով նույնիսկ հոդվածի հրապարակումից առաջ հրամայական է դրա բովանդակությունը ավելացնել «Կոնկրետ տեքստերի» ձևին։ Հակառակ դեպքումԳրագողերը կպատճենեն գրառումը իրենց ռեսուրսում և կլինեն առաջինը տվյալների բազայում: Արդյունքում նրանք կճանաչվեն հեղինակներ։
Google Database
Google-ի համար նույն առաջարկությունները, որոնք մենք նկարագրեցինք վերևում, հարմար են, միայն ծառայությունները տարբեր կլինեն.
- Google+ (փոխարինում է Twitter-ին);
- Google Chrome;
- Google Tools for programmers - «Scan» - «Look like Googlebot» - «Scan» տարբերակ - «Index» տարբերակ;
- որոնում Google-ի ռեսուրսում;
- Google Analytics (Yandex. Metrics-ի փոխարեն).
Արգելք
Ի՞նչ է կայքի ինդեքսավորման արգելքը: Դուք կարող եք այն ծածկել ինչպես ամբողջ էջի վրա, այնպես էլ դրա առանձին մասում (հղում կամ տեքստի հատված): Փաստորեն, կա և՛ գլոբալ ինդեքսավորման արգելք, և՛ տեղական: Ինչպե՞ս է այն իրականացվում:
Եկեք դիտարկենք Robots.txt-ի որոնման համակարգի տվյալների բազայում վեբ կայք ավելացնելու արգելքը: Օգտագործելով robots.txt ֆայլը, դուք կարող եք բացառել մեկ էջի կամ ամբողջ ռեսուրսի վերնագրի ինդեքսավորումը հետևյալ կերպ՝
- Օգտվողի գործակալ՝
- Արգելել՝ /kolobok.html
- Արգելել՝ /foto/
Առաջին կետն ասում է, որ հրահանգները սահմանված են բոլոր PS-ների համար, երկրորդը ցույց է տալիս, որ kolobok.html ֆայլի ինդեքսավորումն արգելված է, իսկ երրորդը թույլ չի տալիս ավելացնել foto թղթապանակի ամբողջ լցոնումը թղթապանակում: տվյալների բազա։ Եթե Ձեզ անհրաժեշտ է բացառել բազմաթիվ էջեր կամ թղթապանակներ, խնդրում ենք նշել դրանք բոլորը Robots-ում:
Որոշակի ինտերնետային թերթիկի ինդեքսավորումը կանխելու համար կարող եք օգտագործել ռոբոտների մետա թեգը: Այն տարբերվում է robots.txt-իցայն, որ միանգամից բոլոր ՀԾ-ներին հրահանգներ է տալիս։ Այս մետա թեգը հետևում է html ձևաչափի ընդհանուր սկզբունքներին: Այն պետք է տեղադրվի էջի վերնագրում պիտակների միջև։ Արգելքի գրառումը, օրինակ, կարող է գրվել այսպես.
Այաքս
Ինչպե՞ս է Yandex-ը ինդեքսավորում Ajax կայքերը: Այսօր Ajax տեխնոլոգիան օգտագործվում է բազմաթիվ վեբ կայքերի մշակողների կողմից: Իհարկե, նա մեծ ներուժ ունի։ Դրա միջոցով դուք կարող եք ստեղծել արագ և արդյունավետ ինտերակտիվ վեբ էջեր:
Սակայն որոնիչ ռոբոտը վեբ ցուցակն այլ կերպ է «տեսնում», քան օգտատերը և բրաուզերը։ Օրինակ, մարդը նայում է հարմարավետ ինտերֆեյսին շարժական բեռնված ինտերնետ թերթերով: Սխալչի համար նույն էջի բովանդակությունը կարող է դատարկ լինել կամ ներկայացվել որպես մնացած ստատիկ HTML բովանդակություն, որի համար սկրիպտները չեն աշխատում:
Դուք կարող եք օգտագործել URL-ը -ով Ajax-ի կայքեր ստեղծելու համար, բայց որոնիչն այն չի օգտագործում: Սովորաբար URL-ի այն մասը -ից հետո առանձնացված է: Սա պետք է հաշվի առնել։ Հետեւաբար, https://site.ru/example-ի նման URL-ի փոխարեն նա դիմում է կատարում https://site.ru հասցեում գտնվող ռեսուրսի գլխավոր էջին։ Սա նշանակում է, որ ինտերնետ թերթիկի բովանդակությունը կարող է չմտնել տվյալների բազա: Արդյունքում այն չի հայտնվի որոնման արդյունքներում։
Այաքսի կայքերի ինդեքսավորումը բարելավելու համար Yandex-ն աջակցեց որոնման ռոբոտի փոփոխություններին և նման վեբ կայքերի URL-ների մշակման կանոններին: Այսօր վեբ վարպետները կարող են Yandex որոնողական համակարգին ցույց տալ ինդեքսավորման անհրաժեշտությունը՝ ստեղծելով համապատասխան սխեմա ռեսուրսների կառուցվածքում։ Դրա համար անհրաժեշտ է՝
- Փոխարինեքնշանը էջերի URL-ումվրա !. Այժմ ռոբոտը կհասկանա, որ կարող է դիմել այս ինտերնետային թերթի բովանդակության HTML տարբերակին:
- Նման էջի բովանդակության HTML տարբերակը պետք է տեղադրվի URL-ի վրա, որտեղ ! փոխարինվել է ?_escaped_fragment_=.-ով