TF-IDF چیست؟

Image for post
Image for post

بیاموزید TF-IDF چیست، چگونه کار می‌کند، چرا بخشی از واژگان SEO است، و مهم‌تر از همه – آیا گوگل از آن به عنوان یک فاکتور رتبه‌بندی استفاده می‌کند یا خیر.

TF-IDF چیست و آیا واقعاً می تواند به استراتژی SEO شما کمک کند؟

اگر فکر کنید، “آن افراد دیوانه سئو… بعد به چه چیزی فکر خواهند کرد؟”

اما این مورد مربوط به این رهبر فکری یا تلاش برای ایجاد یک عبارت جدید نیست.

ادعا: TF-IDF یک عامل رتبه بندی است

اگر به دنبال کسب اطلاعات بیشتر در مورد این موضوع هستید، برخی از عناوین وحشی را خواهید دید که به شما این احساس را می دهند که با عدم تخصیص بودجه به TF-IDF در سال جاری، از دست داده اید:

  • TF-IDF برای سئو: چه چیزی کار می کند و چه چیزی کار نمی کند.
  • TF-IDF: بهترین ابزار بهینه سازی محتوا که سئوکاران از آن استفاده نمی کنند.
  • SEO TF IDF: چگونه رقبای خود را با TF-IDF شکست دهیم.
  • آیا TF-IDF تاکتیک سئوی است که شما از دست داده اید؟

 تبلیغ خدمات رخ نت :  طراحی سایت اصفهان

شواهد برای TF-IDF به عنوان یک عامل رتبه بندی

بیایید با این شروع کنیم: TF-IDF چیست؟(Term frequency–inverse document frequency)

فرکانس اصطلاح-فرکانس معکوس سند اصطلاحی از حوزه بازیابی اطلاعات است.

این رقمی است که اهمیت آماری هر کلمه ای را برای مجموعه اسناد به عنوان یک کل بیان می کند.

به زبان ساده، هرچه یک کلمه بیشتر در مجموعه اسناد ظاهر شود، اهمیت آن بیشتر است و وزن آن عبارت سنگین‌تر می‌شود.

چه ربطی به جستجو دارد؟

خوب، گوگل یک سیستم غول پیکر بازیابی اطلاعات است.

فرض کنید مجموعه‌ای از 500 سند دارید و می‌خواهید آن‌ها را به ترتیب ارتباط با اصطلاح [تحرک و چرخش] رتبه‌بندی کنید.

بخش اول معادله، فرکانس مدت (TF)، به صورت زیر است:

  • اسنادی که شامل هر سه کلمه نیستند را نادیده بگیرید.
  • تعداد دفعاتی که هر عبارت در هر سند باقی مانده ظاهر می شود را بشمارید.
  • فاکتور در طول سند.

چیزی که سیستم به پایان می رسد یک رقم TF برای هر سند است.

اما این رقم به تنهایی می تواند مشکل ساز باشد.

بسته به اصطلاح، همچنان می‌توانید با انبوهی از اسناد و مدارک مواجه شوید و هیچ سرنخ واقعی در مورد اینکه کدام یک به درخواست شما مرتبط است، وجود ندارد.

مرحله بعدی، فرکانس معکوس سند (IDF)، زمینه TF شما را کمی بیشتر می کند.

فراوانی سند = شمارش عبارات در مجموعه سند.

معکوس = معکوس کردن اهمیت اصطلاحاتی که اغلب ظاهر می شوند.

در اینجا، سیستم عبارت [and] را از معادله حذف می‌کند، زیرا می‌توانیم ببینیم که در تمام 500 سند به قدری مکرر رخ می‌دهد که به این جستار خاص بی‌ربط است.

ما نمی خواهیم اسنادی که بیشترین موارد [و] در بالاترین رتبه داشته باشند.

اسنادی که بیشترین وزن را برای [تکان دادن] و [غلتان] دارند، در حالی که برای طول متن عادی می شوند، به احتمال زیاد مربوط به افرادی هستند که به دنبال اطلاعات در مورد [تکان و چرخش] هستند.

شواهد علیه TF-IDF به عنوان یک عامل رتبه بندی

با افزایش اندازه و تنوع مجموعه اسناد، کاربرد این متریک کاهش می یابد.

جان مولر از گوگل در این مورد صحبت کرده و توضیح داده است

«این یک معیار نسبتاً قدیمی است و همه چیز در طول سال‌ها کمی تکامل یافته است. معیارهای بسیار دیگری نیز وجود دارد.»

فکر نمی‌کنم این بگوید که این یک عامل نیست. من فکر می‌کنم که او به وضوح می‌گوید این دیگر آنقدرها مهم نیست.

و به همان اندازه که مردم دوست دارند باور کنند که مولر سعی می‌کند یکی از آنها را تحت فشار قرار دهد، هیچ راهی وجود ندارد که او در این مورد ایراد بگیرد.

شناسایی اینکه کدام اسناد حاوی کلماتی است که جستجوگر در حال پرس و جو است، اولین قدم ضروری در بازگشت پاسخ است.

اما با این گفته، این یک معیار قدیمی است که به تنهایی مفید نیست.

در ایندکس به اندازه گوگل، بهترین کاری که TF-IDF می تواند انجام دهد این است که میلیون ها یا میلیاردها نتیجه را به ارمغان بیاورد.

آیا می توانید برای آن بهینه سازی کنید؟

خیر.

 آشنایی بیشتر با خدمات رخ نت :  طراحی کارت ویزیت در اصفهان

تلاش برای بهینه سازی برای TF-IDF به معنای تلاش برای دستیابی به چگالی کلمه کلیدی خاصی است و به آن پر کردن کلمات کلیدی می گویند.

این کار را نکن

با این حال، این بدان معنا نیست که این مفهوم برای متخصصان سئو اهمیتی ندارد.

TF-IDF به عنوان یک عامل رتبه بندی: حکم ما

آیا گوگل از TF-IDF در الگوریتم رتبه بندی جستجوی خود استفاده می کند – حتی به طور بالقوه به عنوان بخشی اساسی از الگوریتم خود؟

ما می گوییم قطعا نه.

چرا؟ زیرا این یک مفهوم قدیمی (در سالهای تکنولوژیک) بازیابی اطلاعات است.

امروزه، گوگل روش های بسیار برتری برای ارزیابی صفحات وب دارد (به عنوان مثال، بردار کلمات، شباهت کسینوس، و دیگر روش های پردازش زبان طبیعی).

دانستن اینکه آیا کلمه ای که کاربر در جستجوی آن است در یک سند ظاهر می شود یا خیر، تنها اولین قدم است.

TF-IDF بدون هزاران لایه دیگر از تجزیه و تحلیل برای تعیین چیزهایی مانند تخصص، اقتدار و اعتماد، برای مبتدیان چیز زیادی را به حساب نمی آورد.

ادامه مقاله در لینک زیر :