Искусственный интеллект (ИИ) распознавал голосовые заказы в McDonald’s, но вместо воды клал кетчуп и масло либо включал в заказ наггетсы на сотни долларов или добавлял бекон в мороженое. Руководство бизнеса сообщило, что технология однажды все же будет использоваться, но она еще сырая.
Американская корпорация McDonald’s прекратил испытания системы ИИ после неоднократных жалоб клиентов на ошибки в заказах. Об этом в середине июня 2024 г. сообщил телеканал SkyNews.
Компания McDonald’s испытывала систему заказа с ИИ, разработанную компанией IBM, в более чем 100 своих заведениях в США начиная с 2021 г. Технология использует систему распознавания голоса для обработки заказов, но иногда системе не удается распознать голос правильно или верно понять ингредиенты для блюд.
По информации SkyNews, в социальных сетях появились сообщения об ошибках в заказах клиентов. Один клиент получил мороженое с беконом, в другом случае ИИ добавил курицу и клиент получил свой заказ с куриными наггетсами на $213, хотя изначально заказ был на $15.
В видеоролике, опубликованном на частном канале в социальной сети TikTok под названием «Борьба с роботом McDonald’s», женщина пытается заказать ванильное мороженое и бутылку воды у ИИ-помощника. Вместо своего заказа она получила несколько порций мороженого, пакетики с кетчупом, и две порции масла.
«Несмотря на успехи, достигнутые на сегодняшний день, мы считаем, что есть возможность более широко изучить решения для ИИ-помощника, но в будущем», — сообщает компания McDonald’s на своем официальном сайте.
В связи с тем, что McDonald’s решила прекратить партнерство с IBM в области автоматизированного приема заказов (AOT). Эта технология будет отключена во всех ресторанах тестирующих ее в настоящее время, не позднее 26 июля 2024 г.
McDonald’s является лидером в использовании технологий в ресторанах быстрого обслуживания (РБО). Группа внедрила киоски самообслуживания по всей территории США за последние несколько лет и перестроила многие из своих ресторанов, чтобы убрать традиционную возможность обслуживания у стойки. Компания также отметила значительный рост продаж в Великобритании точках McDonald’s, где вид услуги на вынос. Компания заявляет, что уверена в том, что технология ИИ будет частью ее будущего, но не в ближайшее время.
Распознавание речи — это способность машины или программы распознавать слова, произнесенные вслух, и преобразовывать их в читаемый текст. Рудиментарные программы распознавания речи имеют ограниченный словарный запас и могут распознавать слова и фразы только при четком произношении. Более сложные программы могут работать с естественной речью, различными акцентами и языками.
В распознавании речи используется широкий спектр исследований в области информатики, лингвистики и компьютерной инженерии. Многие современные устройства и программы, ориентированные на работу с текстом, оснащены функциями распознавания речи, что позволяет использовать устройство более легко или без использования рук.
Распознавание речи и распознавание голоса — это две разные технологии, и их не следует путать, ведь распознавание речи используется для идентификации слов в устной речи, а технология распознавание голоса — это биометрическая технология идентификации голоса человека.
Системы распознавания речи используют компьютерные алгоритмы для обработки и интерпретации произнесенных слов и преобразования их в текст. Программа превращает звук, записанный микрофоном, в письменную речь, которую могут понять компьютеры и люди, выполняя следующие четыре действия: проанализировать звук; разбить его на части; перевести его в цифровой формат, пригодный для чтения компьютером; и использование алгоритма для подбора наиболее подходящего текстового представления.
Программное обеспечение (ПО) для распознавания речи должно адаптироваться к изменчивой и контекстно-зависимой природе человеческой речи. Программные алгоритмы, обрабатывающие и преобразующие аудио в текст, обучаются на различных речевых паттернах, стилях речи, языках, диалектах, акцентах и фразах. Кроме того, ПО отделяет разговорный звук от фонового шума, который часто сопровождает сигнал. Для того чтобы удовлетворить этим требованиям, ИТ-системы распознавания речи используют два типа моделей: акустические модели — они отражают взаимосвязь между языковыми единицами речи и аудиосигналами; языковые модели — здесь звуки сопоставляются с последовательностями слов, чтобы различать слова, которые звучат похоже.
У систем распознавания речи довольно много применений. Смартфоны используют голосовые команды для маршрутизации звонков, обработки речи в текст, голосового набора и голосового поиска. Пользователи могут отвечать на текст, не глядя на устройство. В смартфонах Apple iPhone распознавание речи используется для работы с клавиатурой и виртуальным помощником Siri. Функционал доступен и на дополнительных языках. Распознавание речи можно найти и в приложениях для работы с текстом, таких как Microsoft Word, где пользователи могут диктовать слова для преобразования в текст.
Есть и другие сфера применения технологии в 2024 г., ПО для распознавания речи используется при обучении иностранным языкам. Программа прослушивает речь пользователя и предлагает помощь в произношении. Автоматические голосовые помощники выслушивают запросы клиентов и предоставляют полезные ресурсы. Врачи могут использовать программы распознавания речи для транскрибирования записей в реальном времени в медицинские карты. Софт может использоваться для расшифровки судебных заседаний, что исключает необходимость в человеке-транскрибаторе. Эта технология анализирует определенные голосовые характеристики, чтобы определить, какую эмоцию испытывает говорящий. В сочетании с анализом настроения это позволяет определить, как человек относится к продукту или услуге. Водители используют голосовое управление для громкой связи, например, для управления телефонами, радиоприемниками и системами глобального позиционирования.