بررسی الگوریتم Bert گوگل و تاثیر آن در سئو
در مورد بهروزرسانیهای الگوریتم جدید گوگل اطلاعات غلط و اغراقهای زیادی وجود دارد. در واقع برت چیست، چگونه کار میکند، و چرا به عنوان کسانی که کارمان SEO است این موضوع برای ما اهمیت دارد؟ «بریتنی مولر» (Britney muller)، متخصص یادگیری ماشین و پردازش زبان طبیعی، برایمان دقیقا توضیح میدهد که «برت»(BERT) چیست و برای صنعت جستجو چه معنایی دارد، به او بپیوندید.
پیادهسازی متن از روی ویدیو
طرفداران Moz سلام، به برنامه دیگری از وایتبورد جمعه خوش آمدید. امروز ما در مورد تمام مسائل برت صحبت میکنیم. بسیار هیجانزدهام و تلاش میکنم واقعا این موضوع را برای همه بشکافم. من ادعا نمیکنم که متخصص «برت» هستم اما تحقیقات زیادی انجام دادهام. من توانستم با برخی از کارشناسان در این زمینه مصاحبه کنم و هدفم تلاش برای تبدیل شدن به یک کاتالیزور برای درک آسانتر این اطلاعات است.
در حال حاضر در صنعت، جاروجنجال زیادی حول و حوش برت و اینکه چگونه شما نمیتوانید برای آن بهینهسازی کنید، در جریان است. در حالی که این موضوع کاملا درست است، شما نمیتوانید، فقط باید محتوای واقعا خوبی برای کاربران خود بنویسید، من هنوز فکر میکنم بسیاری از ما به این قضیه رسیدهایم چون طبیعتا کنجکاو هستیم. اگر کنجکاو هستید که کمی بیشتر در مورد برت یاد بگیرید و بتوانید آن را کمی بهتر برای مشتریان توضیح دهید یا مکالمات بهتری در مورد زمینهی برت داشته باشید، امیدوارم از این ویدئو لذت ببرید. اگر نه، و این مورد برای شما نیست، باز هم خوب است.
هشدار: بیش از حد در مورد برت اغراق نکنید
خیلی هیجانزدهام و می خواهم مستقیم وارد موضوع شوم. اولین چیزی که میخواهم به آن اشاره کنم این است که توانستم با آلیسون اتتینگر که محقق پردازش زبان طبیعی است نشستی داشته باشم. او استاد دانشگاه شیکاگو و یکی از مهربانترین افراد است. بسیار از او سپاسگزارم که وقت گذاشت تا با من در مورد برت صحبت کند.
اولین برداشت من از صحبتی که در هنگام نهار با هم داشتیم این بود که خیلی مهم است بیش از حد اغراق نکنیم. در حال حاضر جاروجنجال زیادی در جریان است، اما هنوز «برت» از درک زبان و متن به همان روشی که ما انسانها میتوانیم آن را درک کنیم، بسیار فاصله دارد. بنابراین فکر میکنم مهم است به خاطر داشته باشید که ما بیش از حد بر روی آنچه که این مدل میتواند انجام دهد تاکید نمیکنیم، اما هنوز هم بسیار هیجانانگیز است و یک لحظه بسیار شگفتانگیز در پردازش زبان طبیعی و یادگیری ماشین است. بدون صحبت اضافی اجازه بدید مستقیم وارد موضوع بشویم.
برت از کجا آمده است؟
میخواهم به همه اطلاعات بیشتری در مورد اینکه برت از کجا آمده و به کجا میرود بدهم. فکر میکنم بسیاری از اوقات این اعلامیهها نوعی بمب هستند که در صنعت SEO ریخته شدهاند، در اصل، یک فریم ثابت از یک سریال بدون ارایه تمام ماقبل و مابعد آن. ما فقط این یک قاب ثابت را میگیریم. پس ما این اعلامیه برت را گرفتهایم، اما اجازه بدهید کمی به عقب بازگردیم.
پردازش زبان طبیعی
به طور سنتی کامپیوترها دورهای داشتند که در آن از درک زبان طبیعی عاجز بودند. آنها میتوانند متن را ذخیره کنند، ما میتوانیم متن را وارد کنیم، اما درک زبان همیشه برای کامپیوترها بسیار دشوار بودهاست. مدتها پیش پردازش زبان طبیعی (NLP) پدید آمد، زمینهای که در آن محققان مدلهای منحصر به فردی را برای حل انواع خاصی از درک زبان توسعه میدهند. چند نمونه عبارتند از: شناسایی موجودیت، طبقهبندی، تحلیل احساسات، و پرسش و پاسخ.
همه اینها به طور سنتی توسط مدلهای جداگانه حل شدهاند که برای حل یک کار زبانی خاص مناسب هستند و بنابراین کمی شبیه آشپزخانه شما به نظر میرسد:
به مدلهای منفرد پردازش زبان طبیعی به عنوان وسایل آشپزخانه خود فکر کنید، همه آنها یک کاربرد بسیار خاص دارند که به خوبی انجام میدهند.
حالا یک ابزار آشپزخانه کاملا آماده را در نظر بگیرید که شامل امکانات ۱۱ مورد از رایجترین ابزارهای مورد استفاده شما در آشپزخانه است. این «برت» است، یکی از ابزارهای آشپزخانه که یازده تا از بهترین راهحلهای پردازش زبان طبیعی را واقعا انجام میدهد، واقعا خوب پس از اینکه به خوبی تنظیم شود.
تمایزی هیجان انگیزی در فضای پردازش زبان طبیعی. به همین دلیل است که مردم واقعا در مورد آن هیجانزده هستند، زیرا دیگر به تمام مدلهای منفرد نیاز ندارند. آنها میتوانند از برت برای حل اکثر کارهای پردازش زبان طبیعی استفاده کنند، در نتیجه منطقی به نظر میرسد که گوگل آن را با الگوریتم اصلی گوگل ترکیب کند.
برت کجا میرود؟
چه چیزی را بیان میکند؟ به کجا میرود؟ آلیسون توضیح میدهد:
«من فکر میکنم که ما برای مدتی در مسیر یکسانی با گذشته پیش خواهیم رفت و انواع بزرگتر و بهتری از برت را خواهیم ساخت که در روشهایی که برت قوی است، قویتر خواهند بود و احتمالا همان محدودیتهای بنیادی فعلی را هم خواهند داشت.»
در حال حاضر چندین نسخه مختلف از برت وجود دارد و ما همچنان موارد بیشتر و بیشتر از آن را خواهیم دید. جالب خواهد بود که ببینیم این فضا به کجا میرود.
چطور برت این قدر باهوش شده است؟
چطور است نگاهی به یک دیدگاه بسیار ساده شده از برت بیندازیم که چطور اینقدر باهوش شدهاست؟
گوگل متن ویکیپدیا و پول زیادی را برای قدرت محاسباتی (واحدهای محاسبهگر TPU که در یک دسته V3 pod قرار میگیرند) را بکار گرفته که میتواند این مدلهای بزرگ را قدرت بخشد. سپس آنها از یک شبکه عصبی بدون نظارت برای یادگیری از تمام متون ویکیپدیا برای درک بهتر زبان و بافت متن استفاده کردند.
نکته جالب در مورد این که چگونه یاد میگیرد این است که هر طول دلخواه از متن را میگیرد (که خوب است چون زبان کاملا به شیوهای که ما صحبت میکنیم اختیاری است) و آن را به یک بردار منتقل میکند. هر بردار یک رشته ثابت از اعداد است. این کار کمک میکند که زبان برای ماشین قابل ترجمه شدن شود.
این موضوع در یک فضای n بعدی واقعا بزرگ اتفاق میافتد که ما حتی نمیتوانیم تصور کنیم. و باعث میشود که موضوعات مشابه متنی در فضاهای برداری مشابه قرار گیرند.
برای هوشمندکردن هرچه بیشتر برت، همانند Word2Vec، از یک تاکتیک به نام «ماسک» استفاده میشود.
ماسکدار کردن زمانی رخ میدهد که یک کلمه تصادفی در یک جمله مخفی شدهباشد.
برت یک مدل دو جهته است که کلمات را قبل و بعد از کلمه پنهان جستجو میکند تا به پیشبینی کلمه کمک کند.
این کار را بارها و بارها انجام میدهد تا زمانی که در پیشبینی کلمات ماسکدار قدرتمند شود. سپس میتواند به خوبی تنظیم شود تا ۱۱ مورد از رایجترین وظایف پردازش زبان طبیعی انجام شود. واقعا، و واقعا هیجانانگیز و یک زمان جالب برای بودن در این فضا.
برت چیست؟
برت یک مدل پردازش زبان طبیعی از پیش آموزشدیده بدون نظارت است. برت میتواند پس از تنظیم دقیق، ۱۱ مورد از اصلیترین وظایف رایج پردازش زبان طبیعی را انجام دهد و در اصل به عنوان تقویتکننده پردازش و درک زبان طبیعی عمل کند.
برت عمیقا دو جهته است، به این معنی که به کلمات قبل و بعد از موجودیتها و متنهای از پیش آموزشدیده از روی ویکیپدیا نگاه میکند تا درک بهتری از زبان ارایه دهد.
چه چیزهایی را برت نمیتواند انجام دهد؟
آلیسون اتتینگر یک مقاله تحقیقاتی بسیار جالب را با نام آنچه که برت نمیتواند انجام دهد را نوشته است. شگفتانگیزترین چیزی که از مقالهاش برداشت میشود حوزه تشخیص نفی بود، به این معنی که برت در درک نفی یا اینکه چیزها چه نیستند، خیلی خوب نیست.
به عنوان مثال، وقتی وارد کنیم که «رابین یک … است»؛ پرنده پیشبینی میشود که درست است، و عالی است. اما وقتی وارد کنیم که «رابین یک … نیست» باز هم پرنده پیشبینی میکند. بنابراین در مواردی که برت نمونهها یا متنهای منفی را ندیده باشد، هنوز از برای درک آنها دچار مشکل میشود. در تحقیق آلیسون انواع موارد بسیار جالب دیگر نیز وجود دارد که به شدت به شما پیشنهاد میکنم آن را بررسی کنید.
برای برت چطور بهینهسازی میکنید؟ (نمیتوانید!)
در نهایت، شما چگونه برای برت بهینه میکنید؟ باز هم نمیتوانید. تنها راه بهبود وب سایتتان است با این بهروزرسانی که محتوای واقعا عالی برای کاربران خود بنویسید و نیاز آنها را برآورده کنید.
یک منبع عالی برای کمک به درک بهتر و نوشتن بهتر برای الگوریتمهای پردازش زبان طبیعی مقاله بیگسبی برای بهسازی صفحه برای موتور جستجو مبتنی بر پردازش زبان طبیعی است
ظرفیت رو به رشد گوگل برای درک سوال به زبان طبیعی
یک چیزی که باید به آن اشاره کنم این است که من صادقانه نمیتوانم موضوعی که جف دین از گوگل در این یادداشت نوشته است را از ذهنم بیرون کنم. او در مورد برت صحبت میکند و سپس به سوالات زبان طبیعی و درک سوالات به زبان طبیعی میپردازد. موضوع مهم برای من این مثال بود، یک نفر سوال پرسید، «آیا میتوانید در حالت هواپیما تماس بگیرید و دریافت کنید؟»
عکس از یادگیری عمیق برای حل مشکلات مهم نکته کلیدی توسط جف دین.
قطعه متنی که در آن لایه ترجمه زبان طبیعی گوگل در تلاش برای درک تمام این متن است، بسیار فنی و سخت است:
حالت هواپیما، حالت هواپیما، حالت پرواز، حالت برونخط، یا حالت مستقل، وضعیتی است که بر روی بسیاری از گوشیهای هوشمند، کامپیوترهای قابلحمل، و دیگر دستگاههای الکترونیکی موجود است و وقتی فعال میشود ارتباطات و ارسال سیگنال های رادیویی توسط دستگاه قطع میشود و در نتیجه بلوتوث، تلفن و وایفای نیز قطع میشود. GPS ممکن است غیر فعال شود یا نشود، چراکه شامل ارسال امواج رادیویی نیست.
با این لایهها، و با استفاده از چیزهایی مانند برت، آنها قادر بودند از کل این زبان پیچیده، طولانی و گیجکننده یک کلمه «نه» را استنتاج کنند و پاسخ بدهند. واقعا، واقعا در فضای ما قدرتمند است.
چیزهایی مانند پاسخهای برجسته را در نظر بگیرید؛ یا چیزهایی مانند ویژگیهای SERP. منظورم این است که این میتواند تاثیر بزرگی در فضای ما داشته باشد. پس فکر میکنم مهم است که یک پالس از مسیری که بر روی آن حرکت میکنند و چه چیزی در این زمینه در جریان است داشته باشیم.
من واقعا امیدوارم که از این قسمت وایتبورد جمعه لذت برده باشید. لطفا اگر سوال یا نظری دارید در زیر مرا در جریان بگذارید. مشتاقانه منتظر دیدار دوباره شما هستم. خیلی ممنون.
منبع: سایت Moz
الگوریتم برت خیلی مهمه و مچکرم که درموردش به این خوبی توضیح دادین
واقعا حرفه ای ترین و باهوش ترین موتور سرچ دنیاست و چقدر الگوریتم های خفن داره