Улучшение доступности: Google AI объединяет эгоцентрическое зрение, мультимодальное восприятие и логико-лингвистическое моделирование для выявления и оценки нарушений у пользователей.

 Revolutionizing Accessibility: Google AI’s Human I/O Unifies Egocentric Vision, Multimodal Sensing, and LLM Reasoning to Detect and Assess User Impairments

Google AI представила Human I/O для решения проблем временных нарушений и ограничений (SIID)

Проблемы временных нарушений и ограничений (SIID) могут существенно влиять на нашу способность взаимодействовать с технологией из-за факторов окружающей среды, таких как шум, освещение и социальные нормы. Эти нарушения могут существенно влиять на способность использования рук, зрения, слуха или речи в различных ситуациях, что приводит к менее эффективному и более раздражающему пользовательскому опыту.

Решение Human I/O

Human I/O – это единая система, использующая эгоцентрическое зрение, мультимодальное восприятие и рассуждения на основе больших языковых моделей (LLM) для обнаружения и оценки SIID. Она предоставляет обобщаемую и расширяемую систему, оценивающую доступность каналов ввода/вывода пользователя (зрение, слух, речь и руки) в реальном времени в различных ситуациях.

Практические решения

Human I/O использует комплексный конвейер, включающий поток данных, обработку и модули рассуждений. Система начинает с потоковой передачи видео- и аудиоданных в реальном времени с устройства с камерой и микрофоном. Модуль обработки анализирует эти данные для извлечения критической информации, а затем использует рассуждения на основе LLM для интерпретации обработанных данных и предсказания доступности каждого канала ввода/вывода.

Human I/O демонстрирует надежную производительность с точностью 82% в предсказании доступности каналов и низкой средней абсолютной ошибкой в оценках.

Заключение

Human I/O является значительным прорывом в создании более адаптивных и контекстно-ориентированных взаимодействий с технологией. Интеграция эгоцентрического зрения, мультимодального восприятия и рассуждений на основе LLM позволяет системе эффективно предсказывать и реагировать на ситуационные нарушения, улучшая пользовательский опыт и производительность.

Мобильная разработка на заказ и готовые решения

Мобильная разработка

Готовые и индивидуальные решения

Веб решения - разработка сайтов и сервисов

Web решения

Получите бесплатную консультацию по веб-разработке прямо сейчас

Аутсорсинг, подбор специалистов и команд разработки

Аутсорсинг

Выберите своего специалиста сегодня и начните свой проект