اگر شما کار بهینه سازی سایت انجام می دهید یا دیجیتال مارکتری هستید که رتبه وبسایت کسب و کارتان در گوگل برای شما مهم است، حتما اخبار بروزرسانی الگوریتم های جدید گوگل را دنبال می کنید. جدیدترین محصول گوگل که پیشرفت های چشمگیری برای موتور جستجوی گوگل به ارمغان آورده و به گفته گوگل بزرگ ترین بروزرسانی این شرکت در ۵ سال اخیر بوده است، الگوریتم BERT نام دارد که امروز در هوداد به بررسی کلی این الگوریتم، نحوه کار و ویژگی های آن می پردازیم.

BERT از کجا آمده است؟

الگوریتم  برت BERT گوگل یک آپدیت جدید از طرف این شرکت در ماه مارس ۲۰۱۹ هست که به جای تمرکز روی کلمه کلیدی یا کلمات کلیدی چند بخشی، به سراغ جملات عامیانه رفته تا درک بهتری از جستجوی کاربران داشته باشد. این تغییر باز هم در جهت تبدیل گوگل از یک موتور جستجو به یک موتور پاسخگو است. کلمه BERT مخفف عبارت Bidirectional Encoder Representations from Transformers است!” این الگوریتم به گوگل کمک می کند تا پردازش زبان طبیعی (NLP) را بهتر درک کند. این قابلیت خصوصاً در جستجوی کلمات محاوره ای و تشخیص حروف اضافه به درد میخورد. اما آیا می دانید که BERT فقط به روزرسانی الگوریتمی نیست؟ در حقیقت یک مقاله تحقیقاتی و علمی است که چارچوب پردازش زبان طبیعی را دنبال می کند و گوگل این تکنولوژی را به صورت متن باز (Open Source) قرار داده است و برخی از افراد تغییراتی در آن ایجاد کرده اند.به طور سنتی درک زبان همیشه برای کامپیوترها بسیار دشوار بوده است. بنابراین ، پردازش زبان طبیعی زمینه ای برای محققان فراهم آورد تا مدلهای منحصر به فردی برای حل انواع خاص نگارش زبانی ، ارائه دهند.

ب. اسلاو کارشناس الگوریتم جستجوی گوگل، برت را این چنین توصیف می کند:

“روشی برای پردازش زبان طبیعی (زبان محاوره) و بر پایه یادگیری ماشین است که می تواند برای پردازش بدنه بزرگی از متن ها استفاده شود. این الگوریتم به گوگل کمک می کند تا زبان طبیعی انسان را به خوبی درک کند.”

الگوریتم BERT گوگل چه چالش هایی را رفع می کند؟

چیزهایی وجود دارد که ما انسان ها به راحتی می فهمیم در صورتی که ماشین ها اصلاً آن را درک نمی کنند. از جمله کلمات مترادف، کلمات چند بخشی و مبهم که برای موتور جستجو همانند کابوس هستند. الگوریتم BERT برای کمک به حل این مسئله بوجود آمد.برت بدون شک پیشرفت اساسی در استفاده از یادگیری ماشین Machine Learning برای پردازش زبان طبیعی داشته است. از سوی دیگر مدل برت در عبارات طولانی می تواند مفهوم کلی یک کلمه را با بررسی کلماتی که قبل و بعد از آن آمده اند پیدا کند حروف اضافه جمله را بررسی کند و هدف کاربر از کل جمله را تشخیص دهد.

این الگوریتم به طور رسمی قابلیت پشتیبانی از ۷۰ زبان را دارد. و توییت رسمی اکانت Google Search Liaison  تایید کرد که از ۱۹ آذر برت روی زبان فارسی هم فعال شده است.

اکانت توئیتر رسمی Google SearchLiaison

نمونه ای از عملکرد الگوریتم BERT گوگل در جمله

عبارت انگلیسی « ?how to catch a cow fishing » را در نظر بگیرید به معنی فارسی “چطور یک ماهی خاردار صید کنم؟”

کلمه « cow» در زبان انگلیسی هم به معنای گاو و هم به معنای نوعی ماهی بزرگ است که در سواحل اقیانوس اطلس صید می شود.

اگر قبل از راه اندازی الگوریتم برت گوگل این جمله را جستجو می کردید، همه نتایجی که گوگل به شما نشان می داد مرتبط با گاو و تصاویر گاو بودند. حتی با وجود کلمه « fishing » هم گوگل متوجه نمی شد که منظور از عبارت شیوه صید این نوع ماهی است.

ولی به لطف الگوریتم برت BERT گوگل، اگر الان این عبارت را جستجو کنید گوگل به خوبی متوجه خواهد شد و بیشتر نتایجی که نشان می دهد مرتبط با شیوه صید ماهی می باشد و صفحه تصاویر پر از عکس این ماهی می شود. الگوریتم برت موجب شده است که گوگل بتواند مفهوم کلمه « fishing » را در جمله درک کند و با تمرکز بر روی مفهوم اصلی جمله نتایج را تغییر دهد. در واقع از این کلمه در جهت یافتن مفهوم اصلی جمله استفاده کرده است.

یا در مثال دیگر…

هنگامی که کاربران عبارت ( ۲۰۱۹Brazil traveler to USA need a visa) را جستجو می‌کردند، موتور جستجو روی کلمات اصلی تمرکز داشت و تلاش می‌کرد نتایجی را به کاربر نشان دهد که شامل این کلمات یا مترادف آن‎ها باشد. اما نتیجه درست بر عکس چیزی بود کاربر دنبالش میگشت. چرا؟ به‌خاطر اینکه در این عبارت علاوه بر کلمات اصلی و معنی آن‌ها، کلمه ربط «TO» و رابطه‌اش با کلمات دیگر برای درک مفهوم جمله بسیار مهم است.

تا قبل از BERT، گوگل این نکات زبانی و اهمیت این ارتباط را نمی‌فهمید و نتایجی شامل اطلاعاتی راجع به «سفر آمریکایی‌ها به برزیل» را نشان می‌داد، در صورتی که کلمه ربط  «TO» نشان می‌دهد که جستجو درباره سفرکنندگان برزیلی به آمریکاست.

مثال الگوریتم BERT

Dawn Anderson یکی از متخصصان الگوریتم جستجو تاثیر این آپدیت در سئو را بدین گونه بیان کرده است که این الگوریتم برای سایت هایی که دارای محتوای ضعیف هستند، ناکارآمد است. او در ادامه اشاره می کند که  سئو سایت  یا همان بهینه سازی موتور جستجو، یک فرایندی است که می تواند سایت را برای موتورهای جستجو بهینه نماید. بنا براین، هر آپدیتی که بر موتورهای جستجو اثر میگذارد، می تواند بر سئو و بهینه سازی سایت هم تاثیر فراوانی بگذارد. در پایان نیز می گوید:

“معنی های متفاوتی برای یک کلمه وجود دارد، معنی اصلی کلمه توسط کلمات پیرامون آن قابل درک است.”

بعضی از کارهایی که BERT نمی تواند انجام دهد چیست؟

آلیسون اتینجر در یک مقاله تحقیقاتی تحت عنوان What BERT Can’t Do به مثال هایی اشاره کرده است که از الگوریتم برت نباید انتظار داشته باشیم. BERT در درک جملات منفی یا چیزهایی که معنای منفی دارند ، خوب عمل نمی کند و هنوز درک این مسئله برایش سخت است. طبق گفته گوگل، این به‌روزرسانی ۱۰درصد نتایج جستجو را تغییر می دهد. یعنی از هر ۱۰ نتیجه، حتماً یکی از آن ها از مدل جدید زبانی الگوریتم Bert گوگل استفاده کرده اند. پس اگر بخواهیم این به‌روزرسانی را به همه کوئری ها تعمیم دهیم، نمیتواند خیلی درست باشد. الگوریتم Bert گوگل بیشتر تمرکز خود را روی کوئری های طولانی و دیالوگ محور قرار داده و چون کلمات کلیدی طولانی معمولاً هدف اول سئو سایت نیست، تغییرات برت هنوز برای بسیاری از سایت ها کاملاً مشهود نیست.

برای آپدیت برت، هیچ راهی جهت بهینه سازی وجود ندارد و چیزی نیست که بتوان تجدید نظر کرد. بهترین کاری که شما می توانید انجام دهید این است که تنها برای کاربر محتوا بنویسید تا سئو سایت شما بهینه شود. زیرا تلاش گوگل برای درک بهتر عبارت تنها یک دلیل دارد و آن هم ارائه نتایجی است که بیشترین ارتباط را با پرس و جو داشته باشند. گوگل پیشنهاد می کند که برای دریافت رتبه، حتما محتوا را طوری برای کاربران بنویسید تا به هنگام  خواندن آن مطلب، نه تنها مشکلشان حل شود، بلکه تمایل داشته باشند که مجددا به آن سایت مراجعه نمایند. از آن جایی که برت یک مفسر برای فهمیدن هدف کاربر بوده است، می تواند این حس را به کاربر انتقال دهد و طبق سرچ او، بهترین نتیجه را به نمایش درآورد.