نظرة عامة شاملة حول ألفازيرو

ألفازيرو أو ألفا زيرو (بالإنجليزية: AlphaZero) هو برنامج حاسوب طورته شركة ديب مايند المتخصصة في أبحاث الذكاء الاصطناعي من أجل إتقان ألعاب الشطرنج والشوغي وغو. وتستخدم خوارزميته منهجا مماثلا لمنهج ألفاغو زيرو.

أصدر فريق ديب مايند في 5 ديسمبر 2017 مطبوعة أولية عرّف فيها عن ألفازيرو، الذي حقق بعد 24 ساعة من التدريب مستوى لعب فاق مستوى البشر في هذه الألعاب الثلاثة وذلك بهزيمة البرامج أبطال العالم ستوكفيش وإلمو ونسخة 3 أيام من ألفاغو زيرو. استخدم ألفازيرو في كل حالة وحدات معالجة موتر (TPUs) مخصصة كانت برامج غوغل قد أُمثِلت لاستخدامها. تدرب ألفازيرو عبر «اللعب مع الذات» فقط باستخدام 5000 وحدة معالجة موتر من الجيل الأول لتوليد المباريات و64 وحدة معالجة موتر من الجيل الثاني لتدريب الشبكات العصبية، كل هذا بالتوازي مع عدم الوصول إلى كتب الافتتاحيات أو جداول نهاية اللعب. بعد أربع ساعات من التدريب، قدَّرت ديب مايند أن ألفازيرو كان يلعب الشطرنج بتصنييف إيلو أكبر من ستوكفيش 8، وبعد تسع ساعات من التدريب هزمت الخوارزميةُ ستوكفيش 8 في مقابلة موقتة من 100 مباراة (28 فوز، 0 خسارة و72 تعادل). لعبت خوارزمية ألفازيرو المدربة على آلة وحيدة تملك أربع وحدات معالجة موتر.

نُشرت الورقة العلمية الخاصة بألفازيرو من قبل ديب مايند في دورية ساينس في 7 ديسمبر 2018. وفي 2019 نشرت ديب مايند ورقة جديدة تعطي تفاصيلا حول ميوزيرو وهي خوارزمية جديدة قادرة على تعميم عمل ألفازيرو، بحيث تلعب كلًّا من ألعاب آتاري وألعاب الرقعة من دون معرفة مسبقة باللعبة أو قوانينها.

قراءة المقال الكامل على ويكيبيديا ←