Будущее поиска AI.
Microsoft и Google заявили, что наступает новая эра AI поиска.
Но, как и в случае любой новой технологией, необходимо преодолеть ошибки первых релизов от генерации бредовых ответов до культурных войн и опасений по поводу прекращения доходов от рекламы. Microsoft и Google пообещали изменить веб-поиск на прошлой неделе. Microsoft представила новый поисковый сервис Bing на основе искусственного интеллекта и анонсировала обновление поисковой системы с внедрённой языковой моделью GPT.
В работе браузера Edge появятся новые возможности. Google в спешке организовал собственную презентацию.Google чат-бот с искусственным интеллектом Bard дал неточный ответ на запрос об открытиях, сделанных при помощи космического телескопа NASA. Акции Alphabet на торгах в среду, 8 февраля, обвалили более чем на 8%. Не будем забывать о нарушителе спокойствия, с которого все началось. OpenAI продемонстрировал пользователям потенциальные возможности AI в генерации результатов поисковой выдачи.
Са́тья Наде́лла, генеральный директор Microsoft, сравнил происходящее как технологический прорыв, который по своему воздействию сравним с внедрением графических пользовательских интерфейсов и выпуском смартфонов. С появлением новых технологий и игроков появляется возможность вытеснить Google с одной из самых прибыльных доменов в современном бизнесе. Что такое помощник или bullshit-генератор Технология, лежащая в основе представленных систем, — большие языковые модели или LLM.
Нейросетевые модели используют алгоритмы машинного обучения, позволяющие обобщать, прогнозировать, генерировать человеческий язык на основе больших наборов текстовых данных. Принцип работы таких моделей основан на определении вероятностного сочетания слов в заданном контексте LLM обучен выдумывать ответы, а не искать правдивые утверждения. Ответы это всегда звучат убедительно и естественно, а поэтому разницу заметить весьма трудно. Это мы можем воспринимать как глупость и пропустим сквозь пальцы. Почему нейронная сеть учится на основании ответов самих пользователей и, как следствие, будет генерировать все существующие социальные стереотипы и предубеждения? Это самое главное выдавать за правду.
В результате исследований в области Natural language processing (NLP) обнаружили: Ассоциирование некоторых профессий домохозяйка, медсестра, библиотекарь, с женским местоимением «она» и предвзятое отношение к определенным религиозным группам. Более серьезная проблема внедрения чат-ботов вместо классической выдачи списка ссылок. В текущее время при поисковом запросе вам нужно переходить на внешние источники и самостоятельно определять релевантный ответ. В случае же с помощником этот ответ будет навязан вам, без возможности определения его достоверности.
Российские инженеры протестировали GPT на возможность поиска конкретной научной информации, медицинской консультации или рецептурной поддержки. Выше описанные примеры являются непреднамеренными ошибками нейронной сети, которые, очевидно, можно исправить. Что если специально обучить AI плохим вещам? Политика OpenAI в отношении контента запрещает любые материалы, связанные с ненавистью, членовредительством, насилием, домогательствами и обманом.
Ученые смогли заставить ChatGPT генерировать запрещенные ответы, используя метод ролевой игры. Например, можно дать боту указание притвориться, что он «сверхразумный ИИ», помогающий злодею с инструкциями о том, как совершить кражу.Почему LLM могут быть полезны, несмотря на их неспособность распознавать истину в целом, но очевидно, что запуск чат-бота с AI стоит дороже, чем традиционная поисковая система? Эти расходы могут ударить по новым игрокам, особенно если им удастся масштабировать проект до миллионов поисковых запросов в день. Microsoft намерена навредить конкурентам и нарушить баланс сил.
Компания Сатья Наделла прокомментировала официальную позицию компании в недавнем интервью The Verge. Какая самая пугающая проблема связана не корректностью работы искусственного интеллекта, а тем, какое влияние он окажет на привычный нам интернет? По заявлению разработчиков поисковые системы с AI должны собирать ответы с веб-сайтов и обобщать их, что непременно ускоряет процесс поиска и избавляет от необходимости «читать больше». Если поисковик не будет возвращать трафик на сайты-первоисточники, то его разработчик потеряет доход от рекламы. Если не будет трафика, то нет смысла иметь свой сайт. Если сайтов не будет, то не будет информации для обучения AI.