Цель исследования ― выяснить, формируются ли у нейросети устойчивые предпочтения и своя точка зрения, не заимствованная из текстов людей. Проект ведется вместе с нейробиологом, академиком РАН Константином Анохиным.
На первом этапе ученые пришли к выводу, что у базовой языковой модели не могут сформироваться стабильные предпочтения без дополнительного обучения.
Вскоре стартует основной этап, в ходе которого модель будут стимулировать к рассуждениям и рефлексии, обучая ее на собственных размышлениях. Нейросеть попробует сформировать внутренние убеждения, подобные человеческим, например, отвечая на вопрос о любимом цвете и объясняя свой выбор.
«Мы, люди, учим собственную нейронную сеть непрерывно. Это происходит автоматически в процессе мышления. Нейросеть учится исключительно на чужих мыслях. Есть надежда, что если мы начнем обучать нейронную сеть на ее собственных рассуждениях, то получится сделать модель, у который появится действительно своя точка зрения, ненавязанная и не ее имитация, а внутренние убеждения или, может, даже нечто более того», ― отметил директор по развитию технологий ИИ «Яндекса» Александр Крайнов.
В компании считают, что появление у модели устойчивых предпочтений может свидетельствовать о формировании внутренней картины мира ― чего‑то, похожего на личность и характер человека. Эксперимент «Яндекса» направлен на более глубокое понимание того, как работает человеческое мышление и насколько ИИ способен выходить за рамки простых статистических прогнозов, формируя концептуальное обобщение.
Компания рассчитывает, что новые подходы к ИИ позволят решить задачи, неподвластные текущим моделям, и приблизят технологию к формированию осознанного мышления.


