Lad 2 Lad 1

Группа IT-компаний

  • Услуги
     
    Услуги
    Разработка
    Разработка ПО Решения на базе AI Интеллектуальные чат-боты Веб-разработка Разработка интернет-магазинов Мобильная разработка Разработка личного кабинета Разработка приложений Эвотор Тестирование программного обеспечения IT-аудит
    Интеграция
    Внедрение 1С:ERP Автоматизация учета Внедрение и сопровождение продуктов 1С Переход на 1С Внедрение 1С:Зарплата и управление персоналом Раздельный учет по ГОЗ и формирование РКМ Автоматизация управления финансами Автоматизация регламентированного учета Автоматизация операционной деятельности и производства
    Дистрибуция
    1С Тензор Р7‑Офис Эвотор
     
  • Отрасли
     
    Отрасли
    Строительство Торговля, ритейл Производство Энергетика и ТЭК
     
  • Кейсы
  • Продукты
     
    Продукты
    Project Lad GPTZATOR
     
  • О компании
     
    О компании
    Структура Контакты Партнеры Карьера
     
  • Медиа
     
    Медиа
    Новости Мероприятия СМИ о нас Статьи
     
Связаться с нами Связаться с нами
 
  • Услуги
     
    Разработка
    Разработка ПО Решения на базе AI Интеллектуальные чат-боты Веб-разработка Разработка интернет-магазинов Мобильная разработка Разработка личного кабинета Разработка приложений Эвотор Тестирование программного обеспечения IT-аудит
    Интеграция
    Внедрение 1С:ERP Автоматизация учета Внедрение и сопровождение продуктов 1С Переход на 1С Внедрение 1С:Зарплата и управление персоналом Раздельный учет по ГОЗ и формирование РКМ Автоматизация управления финансами Автоматизация регламентированного учета Автоматизация операционной деятельности и производства
    Дистрибуция
    1С Тензор Р7‑Офис Эвотор
  • Отрасли
     
    Строительство Торговля, ритейл Производство Энергетика и ТЭК
  • Кейсы
  • Продукты
     
    Project Lad GPTZATOR
  • О компании
     
    Структура Контакты Партнеры Карьера
  • Медиа
     
    Новости Мероприятия СМИ о нас Статьи
+7 (831) 233-36-66 Связаться с нами

 

Главная /  Медиа / 

#статьи

Можно ли научить чат‑бота всегда говорить правду. Часть 2

 

08 апреля 2024 года

~ 1 мин. на чтение

 

#цифровизация

Подпишитесь на рассылку полезных материалов

Электронная почта

Спасибо за подписку!

Вы сможете отказаться от нее в любой момент

#цифровизация

Содержание

— Модель сама определяет, пользоваться ей результатами RAG или нет

Продолжение материала о том, как повысить точность ответов чат-ботов


Эта статья является продолжением анализа существующих способов устранения галлюцинаций чат-ботов и повышения точности их ответа. В прошлый раз был разбор того, как оценивать точность в процессе диалога, а сегодня мы поговорим о методах, которые из научного сообщества уже проникли в такую библиотеку как llamaIndex, но еще не получили освещения на Хабре.

Часть первая тут.

Как пользователи, мы хотим иметь возможность просто загрузить все нужные нам документы в RAG и пользоваться ими без дополнительных настроек. Большинство традиционных подходов RAG также используют полученные документы «как есть», без проверок, являются ли эти документы релевантными или нет. Более того, современные методы в основном рассматривают полные документы как справочные знания, как во время поиска, так и во время использования. Но значительная часть текста в этих извлеченных документах часто не важна для генерации и только затрудняет поиск релевантной информации. А если результат работы ретривера окажется низкого качества, есть большая вероятность получить галлюцинацию в ответе.

Для решения проблемы можно двигаться в нескольких направлениях.

Модель сама определяет, пользоваться ей результатами RAG или нет

На таком подходе основана методология FLARE (Forward Looking Active Retrieval Augmented Generation), которая сочетает в себе методы поиска для получения соответствующей информации из внешних источников данных с RAG и генеративными моделями и стремится смягчить галлюцинации путем интеграции внешней проверенной информации в процессе генерации.

Задача FLARE — ответить на 2 вопроса:

  1. Когда получать? По мнению авторов, обращаться к внешней базе нужно только тогда, когда LLM не хватает необходимых знаний, и LLM генерирует токены с низкой вероятностью.
  2. Что получить? FLARE не просто извлекает контент, но и оценивает следующее предложение, чтобы заранее получить данные и для него тоже.

Существует два типа FLARE — instruct и direct.

FLARE Instruct. Этот режим предлагает модели генерировать определенные запросы для поиска информации. Модель приостанавливает генерацию, извлекает необходимые данные, а затем возобновляет работу, интегрируя новую информацию.

FLARE Direct. Модель использует сгенерированный контент в качестве прямого запроса для извлечения, когда она встречает токены с низкой достоверностью.

Пример работы с Flare можно найти в документации LlamaIndex.

Источник: Хабр


 

Подпишитесь на рассылку полезных материалов

Электронная почта

Спасибо за подписку!

Вы сможете отказаться от нее в любой момент

Контакты для СМИ

pr@lad24.ru

Мария Пашкина

Мария Пашкина

PR-менеджер

Медиа

Все медиа

 

Все материалы Новости Статьи
Все медиа

 

 

#Новости

Lad наградили за заботу о сотрудниках и карьерный рост

 

#Новости

Кейс внедрения Project Lad в книге «Любимый Нижний Новгород»

 

#Новости

ДМС в Lad: забота о здоровье сотрудников через «Кафетерий бенефитов»

 

#Новости

Lad на страницах книги «Любимый Нижний Новгород»

 

 

 

#Новости

Lad наградили за заботу о сотрудниках и карьерный рост

 

#Новости

Кейс внедрения Project Lad в книге «Любимый Нижний Новгород»

 

#Новости

ДМС в Lad: забота о здоровье сотрудников через «Кафетерий бенефитов»

 

#Новости

Lad на страницах книги «Любимый Нижний Новгород»

 

 

 

#Статьи

Реальные кейсы: как начать использовать нейросети и повысить эффективность бизнеса

 

#Статьи

Темплейт для интернет-магазина: как быстро и качественно запустить онлайн-продажи

 

#Статьи

Построение методики, автоматизация раздельного учета ГОЗ и формирования РКМ

 

#Статьи

Искусственный интеллект в действии: автоматизация бизнес-процессов с GPTZATOR

 

 

 

 

 

Написать в Telegram
Мы используем cookie. Это позволяет нам следить за работой сайта, а также использовать данные для улучшения услуг и продуктов. Посещая lad24.ru, вы соглашаетесь с обработкой ваших персональных данных. Подробнее

Услуги

Разработка ПО

Решения на базе AI

Интеллектуальные чат-боты

Веб-разработка

Разработка интернет-⁠магазинов

Мобильная разработка

Разработка личного кабинета

Разработка приложений Эвотор

Тестирование программного обеспечения

IT-аудит

Внедрение 1С:ERP

Автоматизация учета и управления

 

Внедрение и сопровождение 1С

Переход на 1С с SAP

Внедрение 1С:Зарплата и управление персоналом

Раздельный учет по ГОЗ и формирование РКМ

Автоматизация управления финансами

Автоматизация регламентированного учета

Автоматизация операционной деятельности и производства

1С

Тензор

Р7‑Офис

Эвотор

Отрасли И Направления

Строительство

Торговля, ритейл

Производство

Энергетика и ТЭК

Продукты

Project Lad

GPTZATOR

 

Кейсы

О компании

Структура

Контакты

Партнеры

Карьера

Медиа

Новости

Мероприятия

СМИ о нас

Статьи


Lad 3 Группа IT-компаний

Головной офис

ООО «ЛАД-Интеллект»
Входит в состав группы IT-компаний Lad

Адрес: 603093, г. Нижний Новгород, ул. Родионова, д. 23А, оф. 313

Телефон: +7 (831) 2-333-666

E-mail: contact@lad24.ru

© 1992-2025. Все права защищены

Политика обработки персональных данных Файлы cookie