Google, похоже, разрабатывает новую функцию для своего ИИ-помощника Gemini. Она позволит превращать PDF-файлы и другие документы в подкасты. Функция, аналогичная уже существующей в NotebookLM, будет генерировать аудиообзоры загруженных документов, с возможностью интерактивного обсуждения контента виртуальными ведущими.
По предварительным данным, Gemini будет предлагать пользователям создать аудиообзор после загрузки PDF-файла. Это позволит значительно изменить способ восприятия информации. Пока неизвестно, будет ли эта функция доступна в бесплатной версии Gemini, и когда состоится официальный релиз.
Однако возможность превращения текстовых документов в аудиоформат уже сейчас привлекает большое внимание пользователей, поскольку это значительно упрощает процесс потребления информации, делая его более удобным и увлекательным. Google Gemini, имеющий доступ к интернету и возможности обработки различных типов файлов, а также работающий с огромными объёмами данных (до миллиона токенов в продвинутой версии), является перспективным инструментом для решения подобных задач. Gemini API способен описывать, отвечать на вопросы, суммировать и экстраполировать информацию из PDF-документов.
Источник: http://daboom.ru/google-gemini-smozhet-prevrashhat-pdf-fajly-v-podkasty/