Կայքի ինդեքսավորում որոնման համակարգերում. Ինչպես է կայքը ինդեքսավորվում «Yandex»-ում և «Google»-ում

Բովանդակություն:

Կայքի ինդեքսավորում որոնման համակարգերում. Ինչպես է կայքը ինդեքսավորվում «Yandex»-ում և «Google»-ում
Կայքի ինդեքսավորում որոնման համակարգերում. Ինչպես է կայքը ինդեքսավորվում «Yandex»-ում և «Google»-ում
Anonim

Ի՞նչ է կայքի ինդեքսավորումը: Ինչպե՞ս է դա տեղի ունենում: Այս և այլ հարցերի պատասխանները կարող եք գտնել հոդվածում: Վեբ ինդեքսավորումը (ինդեքսավորումը որոնման համակարգերում) որոնման ռոբոտի կողմից տվյալների բազայում կայքի մասին տեղեկատվության ավելացման գործընթացն է, որն այնուհետև օգտագործվում է նման ընթացակարգ անցած վեբ նախագծերի վերաբերյալ տեղեկատվություն փնտրելու համար:

Վեբ ռեսուրսների մասին տվյալները ամենից հաճախ բաղկացած են հիմնաբառերից, հոդվածներից, հղումներից, փաստաթղթերից: Աուդիո, պատկերներ և այլն կարող են նաև ինդեքսավորվել: Հայտնի է, որ հիմնաբառերի հայտնաբերման ալգորիթմը կախված է որոնման համակարգից։

Կա որոշ սահմանափակումներ ինդեքսավորված տեղեկատվության տեսակների վերաբերյալ (flash ֆայլեր, javascript):

Նախաձեռնման կառավարում

Կայքի ինդեքսավորումը բարդ գործընթաց է: Այն կառավարելու համար (օրինակ՝ որոշակի էջի կցումն արգելելու համար), դուք պետք է օգտագործեք robots.txt ֆայլը և այնպիսի հրահանգներ, ինչպիսիք են Allow, Disallow, Crawl-delay, User-agent և այլն:

ինդեքսավորումկայք
ինդեքսավորումկայք

Նաև պիտակները և հենակետերն օգտագործվում են ինդեքսավորման համար՝ թաքցնելով ռեսուրսի բովանդակությունը Google-ից և Yandex ռոբոտներից (Yahoo-ն օգտագործում է պիտակը):

Goglle որոնողական համակարգում նոր կայքերը ինդեքսավորվում են մի քանի օրից մինչև մեկ շաբաթ, իսկ Yandex-ում՝ մեկից չորս շաբաթ:

Ցանկանու՞մ եք, որ ձեր կայքը հայտնվի որոնման համակարգի արդյունքների հարցումներում: Այնուհետև այն պետք է մշակվի Rambler, Yandex, Google, Yahoo և այլն: Դուք պետք է որոնողական համակարգերին (սարդեր, համակարգեր) տեղեկացնեք ձեր կայքի գոյության մասին, այնուհետև նրանք ամբողջությամբ կամ մասամբ կսողան այն։

Շատ կայքեր տարիներ շարունակ չեն ինդեքսավորվել: Նրանց վրա եղած տեղեկատվությունը ոչ ոք չի տեսնում, բացի նրանց տերերից:

մշակման մեթոդներ

Կայքի ինդեքսավորումը կարող է իրականացվել մի քանի եղանակով.

  1. Առաջին տարբերակը ձեռքով ավելացումն է: Դուք պետք է մուտքագրեք ձեր կայքի տվյալները որոնման համակարգերի կողմից առաջարկվող հատուկ ձևերի միջոցով:
  2. Երկրորդ դեպքում որոնիչ ռոբոտն ինքն է գտնում ձեր վեբ կայքը հղումներով և ինդեքսավորում այն: Նա կարող է գտնել ձեր կայքը այլ ռեսուրսների հղումներով, որոնք տանում են դեպի ձեր նախագիծը: Այս մեթոդը ամենաարդյունավետն է: Եթե որոնիչն այս կերպ գտնում է կայք, ապա այն համարում է նշանակալի։

Ժամկետ

Կայքի ինդեքսավորումն այնքան էլ արագ չէ: Ժամկետները տարբեր են՝ 1-2 շաբաթ։ Հեղինակավոր ռեսուրսների հղումները (գերազանց PR-ով և Titz-ով) զգալիորեն արագացնում են կայքի տեղաբաշխումը որոնման համակարգի տվյալների բազայում։ Այսօր Google-ը համարվում է ամենադանդաղը, թեև մինչև 2012 թվականը կարող էր այս աշխատանքը կատարել մեկ շաբաթում։ ԴեպիՑավոք սրտի, ամեն ինչ շատ արագ է փոխվում։ Հայտնի է, որ Mail.ru-ն աշխատում է այս ոլորտի կայքերի հետ շուրջ վեց ամիս։

կայքի ինդեքսավորում Yandex-ում
կայքի ինդեքսավորում Yandex-ում

Կայքի ինդեքսավորումը որոնման համակարգերում հնարավոր չէ յուրաքանչյուր մասնագետի համար։ Որոնողական համակարգերի կողմից արդեն մշակված կայքի տվյալների բազայում նոր էջեր ավելացնելու ժամանակի վրա ազդում է դրա բովանդակության թարմացման հաճախականությունը: Եթե ռեսուրսի վրա անընդհատ թարմ տեղեկատվություն է հայտնվում, համակարգը համարում է այն հաճախ թարմացվող և օգտակար մարդկանց համար: Այս դեպքում նրա աշխատանքը արագացված է։

Դուք կարող եք հետևել վեբ կայքի ինդեքսավորման առաջընթացին վեբ վարպետների հատուկ բաժիններում կամ որոնողական համակարգերում:

Փոփոխություններ

Այսպիսով, մենք արդեն պարզել ենք, թե ինչպես է կայքը ինդեքսավորվում: Հարկ է նշել, որ որոնման համակարգերի տվյալների բազաները հաճախ թարմացվում են: Հետևաբար, դրանցում ավելացված ձեր նախագծի էջերի քանակը կարող է փոխվել (և նվազել, և աճել) հետևյալ պատճառներով՝

  • որոնողական համակարգի պատժամիջոցներ կայքի նկատմամբ;
  • կայքում սխալների առկայությունը;
  • փոփոխելով որոնման ալգորիթմները;
  • զզվելի հոսթինգ (սերվերի անհասանելիություն, որտեղ գտնվում է նախագիծը) և այլն:

Yandex-ի պատասխանները սովորական հարցերի

«Yandex»-ը որոնողական համակարգ է, որն օգտագործվում է բազմաթիվ օգտատերերի կողմից: Համաշխարհային որոնման համակարգերի շարքում այն զբաղեցնում է հինգերորդ տեղը՝ մշակված հետազոտական հարցումների քանակով։ Եթե դրանում կայք եք ավելացրել, տվյալների բազայում ավելացնելը կարող է շատ երկար տևել:

URL-ի ավելացումը չի երաշխավորում դրա ինդեքսավորումը: Սա միայն այն մեթոդներից մեկն է, որով ասվում է համակարգի ռոբոտընոր ռեսուրսի մասին։ Եթե այլ կայքերից մի կայք հղումներ քիչ կան կամ չկան, ապա դրա ավելացումը կօգնի ձեզ ավելի արագ գտնել այն:

կայքի ինդեքսավորում Google-ում
կայքի ինդեքսավորում Google-ում

Եթե ինդեքսավորումը տեղի չի ունեցել, դուք պետք է ստուգեք, թե արդյոք սերվերի վրա անսարքություններ են եղել Yandex ռոբոտից դրա համար հավելված ստեղծելու պահին: Եթե սերվերը հաղորդում է սխալի մասին, ապա ռոբոտը կդադարեցնի իր աշխատանքը և կփորձի այն ավարտել շրջանաձև ճանապարհով: Yandex-ի աշխատակիցները չեն կարող մեծացնել որոնման համակարգի տվյալների բազայում էջեր ավելացնելու արագությունը։

Yandex-ում կայքի ինդեքսավորումը բավականին բարդ խնդիր է։ Դուք չգիտեք, թե ինչպես ավելացնել ռեսուրս որոնման համակարգում: Եթե դրան հղումներ կան այլ կայքերից, ապա ձեզ հարկավոր չէ հատուկ կայք ավելացնել՝ ռոբոտն ավտոմատ կերպով կգտնի այն և ինդեքսավորի այն: Եթե դուք նման հղումներ չունեք, կարող եք օգտագործել «Ավելացնել URL» ձևը՝ որոնման համակարգին հայտնելու, որ կայքը գոյություն ունի:

Հիշեք, որ URL ավելացնելը չի երաշխավորում, որ ձեր ստեղծագործությունը ինդեքսավորվի (կամ ինդեքսավորվի):

Շատերին հետաքրքրում է, թե որքան ժամանակ է պահանջվում Yandex-ում կայքը ինդեքսավորելու համար: Այս ընկերության աշխատակիցները երաշխիքներ չեն տալիս և ժամկետներ չեն կանխատեսում։ Որպես կանոն, քանի որ ռոբոտը իմացել է կայքի մասին, որոնման մեջ նրա էջերը հայտնվում են երկու օրից, երբեմն՝ մի քանի շաբաթից։

Գործընթաց

Yandex որոնման համակարգ
Yandex որոնման համակարգ

«Yandex»-ը որոնողական համակարգ է, որը պահանջում է ճշգրտություն և ուշադրություն: Կայքի ինդեքսավորումը բաղկացած է երեք մասից՝

  1. Որոնող ռոբոտը սողում է ռեսուրսների էջերը։
  2. Բովանդակությունկայքի (բովանդակությունը) գրանցվում է որոնման համակարգի տվյալների բազայում (ինդեքս):
  3. 2-4 շաբաթից տվյալների բազան թարմացնելուց հետո կարող եք տեսնել արդյունքները։ Ձեր կայքը կհայտնվի (կամ չի հայտնվի) որոնման արդյունքներում:

Ինդեքսի ստուգում

Ինչպե՞ս ստուգել կայքի ինդեքսավորումը: Դա անելու երեք եղանակ կա.

  1. Մուտքագրեք ձեր բիզնեսի անունը որոնման տողում (օրինակ՝ «Յանդեքս») և ստուգեք առաջին և երկրորդ էջերի բոլոր հղումները: Եթե այնտեղ գտնեք ձեր մտահղացման URL-ը, ուրեմն ռոբոտը կատարել է իր առաջադրանքը:
  2. Դուք կարող եք մուտքագրել ձեր կայքի URL-ը որոնման տողում: Դուք կկարողանաք տեսնել, թե քանի ինտերնետային թերթ է ցուցադրված, այսինքն՝ ինդեքսավորված։
  3. Գրանցվեք վեբ վարպետների էջերում Mail.ru-ում, Google-ում, Yandex-ում: Կայքի ստուգումն անցնելուց հետո դուք կկարողանաք տեսնել ինդեքսավորման արդյունքները և որոնման համակարգի այլ ծառայություններ, որոնք ստեղծվել են ձեր ռեսուրսի արդյունավետությունը բարելավելու համար:

Ինչու է Yandex-ը ձախողվում:

Google-ում կայքի ինդեքսավորումն իրականացվում է հետևյալ կերպ. ռոբոտը առանց ընտրելու մուտք է գործում կայքի բոլոր էջերը՝ ցածրորակ և բարձրորակ։ Բայց վարկանիշում ներառված են միայն օգտակար փաստաթղթեր։ Իսկ «Յանդեքս»-ը անմիջապես բացառում է բոլոր վեբ աղբը: Այն կարող է ինդեքսավորել ցանկացած էջ, բայց որոնիչն ի վերջո կվերացնի ամբողջ աղբը:

կայքի ինդեքսավորումը որոնման համակարգերում
կայքի ինդեքսավորումը որոնման համակարգերում

Երկու համակարգերն էլ ունեն աճող ինդեքս: Երկու ցածր որակի էջերն էլ ազդում են վեբ կայքի վարկանիշի վրա, որպես ամբողջություն: Այստեղ գործում է մի պարզ փիլիսոփայություն. Կոնկրետի սիրելի ռեսուրսներըօգտատերը իր թողարկման մեջ կզբաղեցնի ավելի բարձր դիրքեր: Բայց այս նույն անհատը դժվարությամբ կգտնի այնպիսի կայք, որն իրեն դուր չի եկել նախորդ անգամ:

Այդ իսկ պատճառով, նախ, անհրաժեշտ է ծածկել վեբ փաստաթղթերի պատճենները ինդեքսավորումից, ստուգել դատարկ էջերի առկայությունը և կանխել ցածրորակ բովանդակության ինդեքսավորումը:

Արագացրեք Yandex

Ինչպե՞ս կարող եմ արագացնել կայքի ինդեքսավորումը Yandex-ում: Հետևեք հետևյալ քայլերին.

  • Տեղադրեք Yandex բրաուզերը ձեր համակարգչում և օգտագործեք այն կայքի էջերը թերթելու համար:
  • Հաստատեք Yandex. Webmaster-ում ռեսուրսը կառավարելու իրավունքները։
  • Հոդվածի հղումը տեղադրեք Twitter-ում: Հայտնի է, որ Yandex-ը այս ընկերության հետ համագործակցում է 2012 թվականից։
  • Ավելացրեք որոնում Yandex-ից կայքի համար: «Ինդեքսավորում» բաժնում կարող եք մուտքագրել ձեր սեփական URL-ները:
  • Մուտքագրեք «Yandex. Metrica» կոդը՝ առանց նշելու «Ինդեքսավորման համար էջեր ուղարկելն արգելված է»:
  • Արտադրեք կայքի քարտեզ, որը գոյություն ունի միայն ռոբոտի համար և տեսանելի չէ հանդիսատեսին: Ստուգումը կսկսվի նրա հետ: Կայքի քարտեզի հասցեն մուտքագրվում է robots.txt կամ համապատասխան ձևով «Webmaster» - «Indexing Settings» - «Sitemap Files»:

միջանկյալ գործողություններ

արագացնել կայքի ինդեքսավորումը
արագացնել կայքի ինդեքսավորումը

Ի՞նչ է պետք անել, մինչև վեբ էջը ինդեքսավորվի Յանդեքսի կողմից: Ներքին որոնման համակարգը պետք է դիտարկի կայքը որպես առաջնային աղբյուր: Այդ իսկ պատճառով նույնիսկ հոդվածի հրապարակումից առաջ հրամայական է դրա բովանդակությունը ավելացնել «Կոնկրետ տեքստերի» ձևին։ Հակառակ դեպքումԳրագողերը կպատճենեն գրառումը իրենց ռեսուրսում և կլինեն առաջինը տվյալների բազայում: Արդյունքում նրանք կճանաչվեն հեղինակներ։

Google Database

Google-ի համար նույն առաջարկությունները, որոնք մենք նկարագրեցինք վերևում, հարմար են, միայն ծառայությունները տարբեր կլինեն.

  • Google+ (փոխարինում է Twitter-ին);
  • Google Chrome;
  • Google Tools for programmers - «Scan» - «Look like Googlebot» - «Scan» տարբերակ - «Index» տարբերակ;
  • որոնում Google-ի ռեսուրսում;
  • Google Analytics (Yandex. Metrics-ի փոխարեն).

Արգելք

Ի՞նչ է կայքի ինդեքսավորման արգելքը: Դուք կարող եք այն ծածկել ինչպես ամբողջ էջի վրա, այնպես էլ դրա առանձին մասում (հղում կամ տեքստի հատված): Փաստորեն, կա և՛ գլոբալ ինդեքսավորման արգելք, և՛ տեղական: Ինչպե՞ս է այն իրականացվում:

Եկեք դիտարկենք Robots.txt-ի որոնման համակարգի տվյալների բազայում վեբ կայք ավելացնելու արգելքը: Օգտագործելով robots.txt ֆայլը, դուք կարող եք բացառել մեկ էջի կամ ամբողջ ռեսուրսի վերնագրի ինդեքսավորումը հետևյալ կերպ՝

  1. Օգտվողի գործակալ՝
  2. Արգելել՝ /kolobok.html
  3. Արգելել՝ /foto/

Առաջին կետն ասում է, որ հրահանգները սահմանված են բոլոր PS-ների համար, երկրորդը ցույց է տալիս, որ kolobok.html ֆայլի ինդեքսավորումն արգելված է, իսկ երրորդը թույլ չի տալիս ավելացնել foto թղթապանակի ամբողջ լցոնումը թղթապանակում: տվյալների բազա։ Եթե Ձեզ անհրաժեշտ է բացառել բազմաթիվ էջեր կամ թղթապանակներ, խնդրում ենք նշել դրանք բոլորը Robots-ում:

Ինչպե՞ս է կայքը ինդեքսավորվում
Ինչպե՞ս է կայքը ինդեքսավորվում

Որոշակի ինտերնետային թերթիկի ինդեքսավորումը կանխելու համար կարող եք օգտագործել ռոբոտների մետա թեգը: Այն տարբերվում է robots.txt-իցայն, որ միանգամից բոլոր ՀԾ-ներին հրահանգներ է տալիս։ Այս մետա թեգը հետևում է html ձևաչափի ընդհանուր սկզբունքներին: Այն պետք է տեղադրվի էջի վերնագրում պիտակների միջև։ Արգելքի գրառումը, օրինակ, կարող է գրվել այսպես.

Այաքս

Ինչպե՞ս է Yandex-ը ինդեքսավորում Ajax կայքերը: Այսօր Ajax տեխնոլոգիան օգտագործվում է բազմաթիվ վեբ կայքերի մշակողների կողմից: Իհարկե, նա մեծ ներուժ ունի։ Դրա միջոցով դուք կարող եք ստեղծել արագ և արդյունավետ ինտերակտիվ վեբ էջեր:

Սակայն որոնիչ ռոբոտը վեբ ցուցակն այլ կերպ է «տեսնում», քան օգտատերը և բրաուզերը։ Օրինակ, մարդը նայում է հարմարավետ ինտերֆեյսին շարժական բեռնված ինտերնետ թերթերով: Սխալչի համար նույն էջի բովանդակությունը կարող է դատարկ լինել կամ ներկայացվել որպես մնացած ստատիկ HTML բովանդակություն, որի համար սկրիպտները չեն աշխատում:

Դուք կարող եք օգտագործել URL-ը -ով Ajax-ի կայքեր ստեղծելու համար, բայց որոնիչն այն չի օգտագործում: Սովորաբար URL-ի այն մասը -ից հետո առանձնացված է: Սա պետք է հաշվի առնել։ Հետեւաբար, https://site.ru/example-ի նման URL-ի փոխարեն նա դիմում է կատարում https://site.ru հասցեում գտնվող ռեսուրսի գլխավոր էջին։ Սա նշանակում է, որ ինտերնետ թերթիկի բովանդակությունը կարող է չմտնել տվյալների բազա: Արդյունքում այն չի հայտնվի որոնման արդյունքներում։

Այաքսի կայքերի ինդեքսավորումը բարելավելու համար Yandex-ն աջակցեց որոնման ռոբոտի փոփոխություններին և նման վեբ կայքերի URL-ների մշակման կանոններին: Այսօր վեբ վարպետները կարող են Yandex որոնողական համակարգին ցույց տալ ինդեքսավորման անհրաժեշտությունը՝ ստեղծելով համապատասխան սխեմա ռեսուրսների կառուցվածքում։ Դրա համար անհրաժեշտ է՝

  1. Փոխարինեքնշանը էջերի URL-ումվրա !. Այժմ ռոբոտը կհասկանա, որ կարող է դիմել այս ինտերնետային թերթի բովանդակության HTML տարբերակին:
  2. Նման էջի բովանդակության HTML տարբերակը պետք է տեղադրվի URL-ի վրա, որտեղ ! փոխարինվել է ?_escaped_fragment_=.-ով

Խորհուրդ ենք տալիս: