Швейцарские исследователи разработали инновационный метод повышения точности ответов крупных языковых моделей, который меняет подход к обработке информации и генерации ответов на запросы.
Несмотря на активное развитие нейросетей, крупные языковые модели вроде ChatGPT все еще склонны к ошибкам: они могут выдавать как точные ответы, так и явно ложные, выдавая их за достоверные. Проблема неточности в текущих ИИ-системах связана с фундаментальной неопределенностью, присущей их работе.
Новый алгоритм SIFT (Semantic Information Filtering Technique), созданный швейцарскими учеными принципиально меняет подход к обработке информации. В отличие от традиционных методов, которые ищут наиболее близкие по смыслу данные, SIFT анализирует семантические векторы в многомерном пространстве, выявляя не просто похожие, а взаимодополняющие фрагменты информации. Это позволяет системе находить и комбинировать различные аспекты запроса, обеспечивая более полные и точные ответы.
Например, при ответе на вопрос «Сколько лет Роджеру Федереру и сколько у него детей?» традиционный ИИ может сосредоточиться на дате рождения, игнорируя информацию о детях, а SIFT находит всю информацию, объединяя в ответе оба типа данных.
Технология не только повышает качество ответов за счет исключения избыточной информации, но и оптимизирует вычислительные ресурсы. В ходе испытаний исследователям удалось достичь производительности, превосходящей крупнейшие языковые модели, при этом их система была в 40 раз компактнее. Это открывает перспективы создания более эффективных и доступных ИИ-решений.
Особый интерес представляет потенциал применения SIFT в различных отраслях. Так, в частности, в медицине алгоритм может помочь выделить ключевые диагностические показатели среди второстепенных данных. Не менее весомые преимущества метод предлагает для научных исследований и бизнес-аналитики, где важно отделять существенную информацию от фоновой.