وبلاگ

تحلیل و بررسی فاکتور های یاندکس

۱۰ بهمن ۱۴۰۱ مسترسئوکار سئو

من علاقه زیادی به فاکتور های رتبه بندی دارم، اخیرا هم که فاکتور های موتور جستجوگر روسی یاندکس لو رفته فرصت خوبی برا من بود که بشینم و دانشم رو به چالش بکشم و کنارش چنتا چیز جدید یاد بگیرم.

اولین با این توئیت خبر هک شدن یاندکس رو در تاریخ 26 جولای داده و لینکی گذاشته که به یکی از انجمن های اینترنتی میره ک توش 44.71 گیگ سورس کد موتور جستجوی یاندکس وجود داره که یکی از فایل های مربوط به فاکتورهای رتبه بندی یاندکس میشد.

داخل فاکتور های لو رفته یاندکس چنتا متغییر و عامل بودن که توی همه فاکتور ها تعدادی لیست شده بودند و داکیومنتی براشون جایی نبود ولی با بررسی دقیق میشد فهمید که چه متغییری مربوط به چی میشد، که در ادامه سعی می کنم بیشتر توضیح بدم.

تعداد تکرار هر کدوم از متغییر ها رو میتونین داخل فاکتور ها ملاحظه کنین که هر متغییری که بیشترین تکرار رو داره میشه احتمال داد که تاثیر زیادی روی فاکتور های رتبه بندی داره.

پارامتری به اسم AntiSeoUpperBound داخل مستندات وجود دارد که کمترین مقدارش مربوط به فاکتور “FI_QUERY_URL_CLICKS_FRC_REG” و مقدار 0.25 هستش و بیشترین مقدارش 1 و چندین فاکتور مقدار 1 رو دارن. این پارامتر احتمالا ضریب تاثیر فاکتور مورد نظر نسبت به سایر فاکتور ها باشه و مقدار index صرفا عدد شاخص برای شناسایی هستش و ترتیب لیست شدن لاخل فاکتور ها به درجه اهمیت اون ها ربطی نداره.

برای جستجو بین فاکتورهای یاندکس هم میتوانید به مطلب فاکتورهای یاندکس مراجعه کنید که توضیحاتش رو ترجمه کردم و داخل مقاله گذاشتم یا به آدرس yandex-explorer.herokuapp.com مراجعه کنید و میان فاکتور ها جستجو کنید.

دسته بندی فاکتورهای یاندکس بر اساس نوع:

  • فاکتورهای پایه سئو (DOC)
  • فاکتورهایی که مربوط به مقادیر ثابت محتوا می شود
  • فاکتور های مربوط به کوئری سرچ کاربر
  • فاکتورهای مربوط به هاست
  • فاکتورهای مربوط به آنکر تکست ها
  • فاکتور های پویا و متغییر
  • فاکتور های مربوط به رفتار کاربر

فاکتورهای منسوخ یاندکس:

طبق بررسی انجام شده از کل 1922 فاکتور حدود 1273 تا برچسب های مربوط به منسوخ بودن و عدم استفاده خورده اند. که  کل فاکتورهای مفید رو به عدد 649 رسونده.

این فاکتورهای زیر در هر فاکتوری اومده باشه یعنی دیگه تاثیر گذار نیست و ازش استفاده نمیشه

  • unimplemented
  • depreciated
  • unused

فاکتورهای پایه سئوی یاندکس:

  • IsHTML (نوع صفحه HTML و داکیومنت تایپ اون)
  •  IsPo (صفحات جوجه)
  • IsFake (صفحات جعلی)
  • IsUnreachable (صفحه غیر قابل دسترس است تابع muzzle نتوانسته محتوای صفحه را ببیند)
    IsHttps (آیا این صفحه با پروتکل HTTPS محافظت شده است)

فاکتورهای مربوط به کوئری سرچ کاربر:

  • LongQuery (مجموع idf های کلمات کوئری)
  • WordCount (حداقل تعداد کلمات کوئری تقسیم بر 10)
  • InvWordCount (1 تقسیم بر تعداد کلمات موجود داخل هر درخواست)
  • SyntQuality (آیا کوئری سرچ کاربر دارای تجریه تحلیل کامل است)
  • ExpectedFound (تعداد جستجوی مورد انتظار (استاندارد) هر کوئری)

فاکتور های مربوط به بررسی محتوا:

  • IsEShop (بررسی تجاری و فروشگاهی بودن صفحه)
  • IsMainPage (اگر صفحه اصلی مربوط به مالک باشد، ضریب 1 است)
  • Long (محتوای طولانی در صفحه – هرچقدر محتوا طولانی باشد ارزش بیشتری ارائه میکند)
  • IsForum (محتوای فروم و انجمن های اینترنتی را از طریق FORUM_DETECTOR تشخیص می دهد)

فاکتور های پویا و متغییر یاندکس:

  • FreshNewsDetectorPredict (مقدار تشخیص دهنده خبر که توسط الگوریتم و تابع behemoth محاسبه میشود – اگر از حد نساب پایین تر باشد همیشه 0 است)
  • PiracyDetectorPredict (مقدار خروجی تابع pirate detector  که توسط الگوریتم و تابع behemoth محاسبه میشود)

فاکتورهای مربوط به آدرس صفحات (URL)

  • UrlLen (طول URL تقسیم بر 5)
  • IsObsolete (یک تاریخ باستانی در URL وجود دارد که آنها را اخبار باستانی میشناسد. فاکتور 1 اگر نشانی وب بعد از سال 2007 باشد.)
  • OnlyUrl (تمامی موارد فقط داخل URL باشد و هیچ موردی داخل محتوای صفحه وجود نداشته باشد)
  • IsCom (اگر پسوند یا TDLT صفحه دات کام باشد)
  • UrlHasNoDigits (هیچ عددی داخل آدرس صفحه وجود نداشته باشد)
  • NumSlashes (تعداد اسلش های موجود در آدرس URL)
  • IsNotCgi (بررسی وجود علامت سوال ؟ در آدرس – بطور واضح بررسی وجود پارامتر های CGI داخل آدرس)

فاکتورهای مربوط به موقعیت جغرافیایی (GEO)

  • GeoCityUrlRegionCity (آدرس های جغرافیایی استخراج شده از آی پی کاربر یا آدرس صفحات)
  • GeoCityUrlGeoCityCity (استخراج شهر مربوط به آدرس صفحه)
  • GeoCountryUrlGeoCountry (استخراج کشور مربوط به آدرس صفحه)

فاکتورهای مربوط به هاست

  • IsBlog (بررسی بودن یا نبودن صفحه مقالات یا بلاگ blog)
  • IsWiki (آیا آدرس مورد نظر مربوط به ویکی پدیای روسیه است ru.wikipedia.org)
  • IsOwner (آیا میزبان سایت و مالک سرور یکی است – الزاما با بررسی ریدایرکت آی پی به دامنه میشود متوجه شد که آیا هاست اشتراکی است یا نه سرور اختصاصی فقط این سایت را میزبانی می کند)
  • NastyHost (کوئری هایی که توسط هاست نمایش داده شده و روی آنها کلیک شده است!! )

فاکتورهای مربوط به مرورگر و رفتار کاربر:

  • YabarHostSearchTraffic (سهم ترافیک سایت از موتورهای جستجوهای دیگر – استخراج دیتا از طریق نوار یاندکس)
  • VisitsFromWiki (تعداد بازدیدها ها و ورودی (به / از) آدرس های اینترنتی ویکی پدیا)
  • BrowserHostDwellTimeRegionFrc (نسبت زمان ماندن کاربر روی سایت در یک منطقه مشخص نسبت به زمان ماندن در همه مناطق)
  • BrowserBookmarksUrl (هر چه کاربران بیشتری یک URL را به بوکمارک ها اضافه کنند امتیاز مثبت)
  • More90SecVisitsShare (سهم بازدیدهایی که مدت زمان ماندن در صفحه بیش از 90 ثانیه است)
  • VisitorsReturnMonthNumber (تعداد کاربرانی که در طول ماه برگشتند)

فاکتورهای مربوط به بک لینک:

  • LinkQuality: کیفیت لینک های ورودی
  • LR : ارتباط پیوند
  • NumLinks: تعداد لینک های ورودی.
  • Megafon: فراوانی نسبی کلمات در پیوندها
  • NewLinkQuality: طبقه بندی کیفیت لینک های ورودی 2
  • XLRgood: سهم لینک های “خوب” چقدر است؟
  • XLRmanyBad: چه تعداد لینک بد دارد؟
  • LinkAge: میانگین سن پیوندهایی که چیزی را به پیوند LR رساندند

مقایسه درجه اهمیت برخی از فاکتور های یاندکس:

ضریب اسم فاکتور
0.564095297 FI_URL_DOMAIN_FRACTION
0.369078039 FI_QUERY_DOWNER_CLICKS_COMBO
0.345115883 FI_MAX_WORD_HOST_CLICKS
0.315439457 FI_MAX_WORD_HOST_YABAR
0.276250497 FI_IS_COM
0.254915496 FI_OQ_BCLM_PLAIN
0.231000482 FI_OWNER_CLICKS_PCTR
0.230257145 FI_MAX_WORD_HOST_RANK
0.219595036 FI_QUERY_DOWNER_CLICKS_PCTR
0.214713694 FI_QUERY_DOWNER_CLICKS_FRC
0.209866937 FI_DOM_PHRASE_CLICK_RANK_BI
0.209508534 FI_OWNER_REQS_POPULARITY
0.205699196 FI_HAS_NO_QUERY_SHOWS
0.205184905 FI_DOM_PHRASE_YABAR_BI
0.202186194 FI_QUERY_DOWNER_WEIGHT_CLICK
0.18974311 FI_OWNER_NAV_QUOTA
0.185032224 FI_QUERY_DOWNER_ONLY_CLICK_RATE
0.182867833 FI_PAGE_RANK
0.179216994 FI_QUERY_DOWNER_ONLY_CLICK_RATE_REG
0.178646516 FI_SUBQUERY_THEME_MATCH_A
0.166327421 FI_OWNER_CLICKS_PCTR_REG
0.165031404 FI_HAS_DETERMINED_CITIES
0.160420714 FI_QUERY_DOWNER_CLICKS_COMBO_REG
0.160379345 FI_HAS_NO_QUERY_DOWNER_SHOWS
0.15671244 FI_REG_HOST_RANK
0.152953809 FI_QUERY_DOWNER_WS_MAX_WHR_AND_ONLY_CLICK_RATE
0.148292223 FI_QUERY_DOWNER_SATISFIED4_RATE
0.147136648 FI_QUERY_DOWNER_YABAR_VISITS
0.12966893 FI_OQ_BM25_LEM
0.129641402 FI_FIRST_WORD_HOST_CLICKS
0.12797973 FI_YABAR_HOST_AVG_ACTIONS
0.126700169 FI_OWNER_SESS_NORM_DUR
0.125675708 FI_OQ_BM25_STR
0.122090633 FI_QUERY_DOWNER_YABAR_AVG_TIME
0.119512833 FI_QUERY_DOWNER_YABAR_VISITORS
0.118638181 FI_QUERY_DOWNER_CLICKS_FRC_REG
0.115262514 FI_QUERY_DOWNER_WEIGHT_CLICK_REG
0.114624515 FI_MATRIXNET
0.113671588 FI_QUERY_MINONE
0.11292877 FI_TITLE_TRIGRAMS_Q
0.112334631 FI_OQ_BM25_SYN
0.105135837 FI_OQ_BCLM_WEIGHTED
0.103903118 FI_QUERY_COMMERCIALITY_MX
0.102548298 FI_OWNER_SATISFIED4_RATE
0.097713692 FI_SHOP
0.097073501 FI_IS_HUB
0.096811143 FI_LINK_WEIGHTED_FORMS
0.096447224 FI_DIFFERENT_INTERNAL_LINKS
0.094045741 FI_NUM_LINKS_FROM_SEGMENT_CONTENT
0.093045433 FI_MPSA
0.089404211 FI_URL_LINK_PERCENT
0.087850313 FI_QUERY_DOWNER_WS_FRC_AND_BM25F_DPR_FIXED
0.087122791 FI_PAGE_RANK_UKR
0.085929172 FI_YABAR_HOST_VISITORS
0.085276276 FI_DOM_PHRASE_YABAR
0.084699402 FI_GEO_RELEV_ALIEN_CITY
0.084012276 FI_GEO_RELEV_REGION_COUNTRY
0.082967074 FI_GEO_REGION_PROXIM
0.081289466 FI_IS_NOT_RU
0.080331864 FI_SYN_FL_REMAP2
0.078872214 FI_LINK_BREAK
0.077454132 FI_QUERY_DOWNER_CLICK_SUMMARY
0.076343384 FI_DOM_PHRASE_CLICK_RANK
0.075434935 FI_TEXT_BM25_ATTEN_SYN
0.074172193 FI_YABAR_HOST_AVG_TIME2
0.071481761 FI_QUERY_DOWNER_SATISFIED4_RATE_REG
0.071417327 FI_YABAR_HOST_INTERNAL_TRAFFIC
0.071242787 FI_PAGE_RANK_BONUS
0.070074396 FI_TITLE_IDF_SUM
0.069696683 FI_LONGEST_TEXT
0.069268622 FI_EXPECTED_FOUND
0.067151098 FI_YABAR_URL_VISITS
0.066890922 FI_URL_BM25
0.064310715 FI_URL_TRIGRAMS
0.062753582 FI_LAST_WORD_HOST_CLICKS
0.062474191 FI_NON_COMM_NORM_LR_LOG_RELEV
0.061675217 FI_SOWNER_MAX_SUM_SOURCE_RANK
0.061031422 FI_HEADING_IDF_SUM
0.060594485 FI_LERF_LR_LOG_RELEV
0.059222635 FI_BF_LEMMA_ALL
0.058870258 FI_BM25F_DPR_FIXED
0.058415162 FI_LONG_QUERY_SYN
0.05705355 FI_PERCENT_WORDS_IN_LINKS
0.056552232 FI_PAGE_REGION_SIZE_IN
0.055767877 FI_TLP1_ALL
0.055185094 FI_URL_NGRAMS_MODEL
0.054926148 FI_QUERY_REF_TRIGRAM_Q
0.054680076 FI_QUERY_DOWNER_CLICK_SUMMARY_REG
0.054576898 FI_LANGUAGE_COMPLIANCE
0.054156294 FI_BM25F_DPR_OBSOLETE
0.051465614 FI_GEO_CITY_PROXIM
0.051057813 FI_YABAR_URL_VISITORS
0.050576094 FI_NUM_SLASHES
0.049845925 FI_SR
0.049061648 FI_LINK_RELEV
0.047914113 FI_QUERY_DOWNER_CLICKS_PCTR_REG
0.047164043 FI_TITLE_IDF_SUM_FIXED
0.04689109 FI_LINK_PAIR_SYN
0.046783126 FI_Q_DIVERSITY
0.046757968 FI_DBM35
0.044511156 FI_LERF_GEO_LR_LOG_RELEV
0.042452795 FI_LR_GEO_RELEV_REGION_COUNTRY
0.038806478 FI_PASSAGE_LEGACY_TR
0.038372461 FI_LCOR
0.038263041 FI_STATIC_TITLE_LR_BM25
0.037180374 FI_COUNTRY_Q_DIVERSITY
0.035447186 FI_LINK_BREAK_SYN
0.033485834 FI_HIT_NUM_100
0.032525279 FI_OWNER_SDIFF_SHOW_ENTROPY
0.031399776 FI_TLBM25
0.031186244 FI_WORDS_IN_TITLE
0.030786458 FI_BCLM
0.030334787 FI_LONG_QUERY
0.027302374 FI_YA_BAR
0.02692651 FI_LOG_LR
0.026650508 FI_TRIGRAMS_COND_PROB
0.02580664 FI_URL_SESS_NORM_DUR_RATE
0.025691574 FI_IDF_VARIANCE
0.025328926 FI_URL_SESS_NORM_DUR_RATE_REG
0.024263432 FI_COUNTERS_SEARCH_TRAFFIC1
0.024006118 FI_TEXT_BREAK_EX
0.023610887 FI_QUERY_URL_CLICKS_FRC_REG
0.022803839 FI_TEXT_WEIGHTED_FORMS
0.021178675 FI_NEW_LINK_QUALITY
0.021178675 FI_NEW_LINK_QUALITY_FIXED
0.019988664 FI_CATALOG_RELEV
0.019740982 FI_SWBM25
0.019580616 FI_MEAN_WORD_LENGTH
0.019301159 FI_LINKS_IN_TITLE_TRIGRAMS
0.019119257 FI_LINK_RELEV_PHRASE
0.017641844 FI_QSEGMENTS_BREAKS
0.016179975 FI_STATIC_TITLE_BM25_EX
0.013900532 FI_PERIODIC_LINK_DATES_PERCENT
0.01341234 FI_GSK_URL_MODEL
0.013370501 FI_LR_GEO_RELEV_REGION_NATDOM
0.01317158 FI_GEO_COUNTRY_PROXIM
0.013112576 FI_LINK_QUALITY_FIXED
0.012081787 FI_COUNTRY_QUERY_REGIONALITY
0.011650367 FI_FEM_MAS_NOUNS_PORTION
0.010872235 FI_SYNT_QUALITY
0.010581678 FI_SEGMENT_AUX_ALPHAS_IN_TEXT
0.009455905 FI_LINK_SPEED
0.009314594 FI_GEO_LR_LOG_RELEV
0.00842683 FI_SPAM_KARMA
0.007908809 FI_URL_LENGTH_2
0.006691169 FI_ADD_TIME
0.006678481 FI_YABAR_HOST_SEARCH_TRAFFIC
0.005160158 FI_PHRASE
0.004768008 FI_OWNER_SDIFF_SHOW_ENTROPY_REG
0.003890338 FI_YABAR_URL_AVG_TIME
0.003622338 FI_QUERY_ISHUM
0.003363499 FI_COMM_LINKS_SEO_HOSTS_NON_COMM
0.003128581 FI_LR_AMORTIZED_BY_AGE
0.002431407 FI_SYN_FL_REMAP1
0.001181037 FI_Q_DIVERSITY2
0.000692523 FI_C_IN_DEGREE_2
0.000426529 FI_LINK_AGE
9.46964E-05 FI_LERF_LANG_LR_LOG_RELEV
1.36523E-07 FI_FIELD_LM
-0.000807198 FI_DMOZ_QUERY_BEST_THEME
-0.000832707 FI_PAGE_REGION_REL_COVERAGE
-0.000833437 FI_GOOD_RATIO
-0.000843496 FI_GEO_GEOMETRY_PROXIM
-0.001158034 FI_URL_LEN
-0.001209701 FI_COUNTRY_Q_DIVERSITY2
-0.001250755 FI_ADV_PRONOUNS_PORTION
-0.001564276 FI_LINK_QUALITY
-0.00217085 FI_TRIGRAMS_PROB
-0.003021983 FI_TRLR_QUORUM_LEMMA
-0.005028752 FI_TOCM
-0.005085205 FI_QCLASS_OAO
-0.005976754 FI_ADJ_PRONOUNS_PORTION
-0.0066794 FI_TEXT_PAIR_EX
-0.006950709 FI_PAGE_REGION_INV_SIZE_IN
-0.007634608 FI_YABAR_HOST_AVG_TIME
-0.008656938 FI_TEXT_FORMS
-0.010850511 FI_SECOND_INDEG_DISTR_XI
-0.011207583 FI_NUM_NON_LETTERS_IN_URL
-0.011221458 FI_LR_WITHOUT_RARE
-0.01129677 FI_OWNER_SDIFF_CSRATIO_ENTROPY
-0.011681968 FI_SEGMENT_AUX_SPACES_IN_TEXT
-0.012429222 FI_PARTICLES_PORTION
-0.012919083 FI_TEXT_HEAD_SYN
-0.01351045 FI_MORNING_QUERY
-0.015212587 FI_TEXT_MAX_FORMS
-0.016033504 FI_TEXT_FEATURES
-0.01693261 FI_TEXT_PAIR_W1
-0.017928064 FI_OWNER_SDIFF_CLICK_ENTROPY
-0.018278528 FI_QUERY_ISORG
-0.020210221 FI_PERCENT_FREQ_WORDS
-0.020628034 FI_URL_QUERY_VARIETY_REG
-0.020921643 FI_TEXT_PAIR
-0.022152881 FI_TEXT_PAIR_SYN
-0.023916011 FI_OWNER_SDIFF_CSRATIO_ENTROPY_REG
-0.025355499 FI_QDOWNER_STAT_POWER
-0.027287689 FI_QUERY_ISGEO
-0.028595315 FI_SEO_IN_PAY_LINKS
-0.028608739 FI_RINGS_HOST_RANK_BADNESS_3
-0.030877747 FI_PAGE_REGION_SIZE
-0.03200481 FI_HOST_SIZE
-0.032269053 FI_PLM
-0.032828346 FI_PERCENT_VISIBLE_CONTENT
-0.034716207 FI_PAGE_DATE
-0.036381245 FI_RINGS_HOST_RANK_BADNESS_1
-0.036532955 FI_RINGS_HOST_RANK_BADNESS_OLD
-0.037878047 FI_TEXT_HEAD
-0.039215257 FI_TEXT_HI_RELEV_SYN
-0.039575532 FI_TEXT_HEAD_EX
-0.044940113 FI_YMW_FULL
-0.044940113 FI_YMW_FULL2
-0.04496356 FI_NEVASCA2
-0.045942748 FI_HOST_RELIABILITY
-0.046030869 FI_YABAR_URL_LCAC
-0.053739169 FI_QUERY_WORD_COHESION_TR
-0.057014033 FI_COUNTERS_SEARCH_TRAFFIC2
-0.057628363 FI_QSEGMENTS_WEIGHT
-0.057658303 FI_METRIKA_URL_CORE_AUDIENCE
-0.059299976 FI_QSEGMENTS_BM25
-0.059871382 FI_QUERY_MAXONE
-0.06092278 FI_LINKS_WITH_WORDS_PERCENT
-0.062810309 FI_TRLR_QUORUM_FM
-0.063761467 FI_PAGE_REGION_COVERAGE
-0.063976586 FI_PERCENT_USED_FREQ_WORDS
-0.065082392 FI_LR_MAX_DPR
-0.065128132 FI_DOC_LEN
-0.066463229 FI_IS_COMM
-0.067337343 FI_LARGEST_SY_INEXACT_GROUP
-0.068235863 FI_HEADING_IDF_SUM_FIXED
-0.06980368 FI_RELEV_GEO_LINKS_PERCENT
-0.070483298 FI_LOCM
-0.070483298 FI_SYNSET_LOCM
-0.076334972 FI_TITLE_IN_LINKS_TRIGRAMS
-0.077504879 FI_TEXT_SKIP_PAIR
-0.083831129 FI_LINKS_WITH_ALL_WORDS_PERCENT
-0.084798681 FI_LONG
-0.086731079 FI_NUM_LATIN_LETTERS
-0.091993053 FI_QUERY_CITY
-0.094096849 FI_TEXT_LIKE
-0.09426122 FI_YANDEX_ADV
-0.096496415 FI_QUERY_REF_TRIGRAM_R
-0.09727753 FI_AURA_DOC_LOG_AUTHOR
-0.097686305 FI_AURA_DOC_LOG_SHARED
-0.109820339 FI_TEXT_RELEV_PHRASE
-0.110593487 FI_AURA_DOC_MEAN_SHARED_WEIGHT
-0.116819481 FI_TEXT_BRAEK_SYN
-0.118606351 FI_QUERY_WORD_SEQUENCES_TR
-0.118870879 FI_QUERY_DOWNER_ENOUGH_CLICKED
-0.123814719 FI_ESHOP_VALUE
-0.133931985 FI_CLASSIF_IS_SHOP
-0.141668202 FI_PCT_LINKS
-0.160285062 FI_OWNER_SDIFF_CLICK_ENTROPY_REG
-0.162220617 FI_URL_PATH_AND_PARAMS_FRACTION
-0.168645758 FI_GEO_CITY_URL_REGION_COUNTRY
-0.180963639 FI_COMM_LINKS_SEO_HOSTS
-0.194376877 FI_QURL_STAT_POWER
-0.207437367 FI_DATER_AGE
-0.250928464 FI_ADV

منابع:

  • https://gist.github.com/lord-alfred/97400a79f10f3bb13bb4bcd42268b1f8
  • https:// twitter.com/dom_woodman/status/1619028735608639488
  • https:// twitter.com/RobOusbey
  • https:// twitter.com/alton_lex


اگه سوالی دارین توی قسمت کامنت ها بپرسین

آخرین مقالات من

10 بهمن 1401

دانلود

لطفا برای دریافت لینک دانلود حتما اطلاعات خواسته شده را صحیح وارد نمایید.