Анализ документов при помощи нейросетей — задача со звёздочкой, хотя, казалось бы, обученный на огромном массиве данных искусственный интеллект должен легко с ней справляться. Однако популярные чат-боты в таких ситуациях галлюцинируют значительно чаще среднего и требуют тонкой донастройки для получения корректного результата. NotebookLM от Google эффективно решает эту проблему.
NotebookLM работает на основе модели Gemini Pro. В отличие от традиционных чат-ботов, которые опираются на общие знания из интернета, эта модель строит свои ответы исключительно на загруженных пользователем документах. Это существенно повышает точность анализа и делает инструмент отличным помощником при работе с большими объёмами данных. На момент публикации этого текста он работает с Google Docs, файлами в форматах PDF, Markdown и TXT, аудиозаписями, ссылками на веб-страницы и видео на YouTube. Как и в других продуктах Google, в NotebookLM предусмотрен режим совместной работы.
Описание и базовые функции
На главной странице новому пользователю предлагается создать свой первый блокнот и добавить в него документы. Каждый из блокнотов может содержать до 50 источников (документов, ссылок или файлов) в бесплатной версии и до 300 — в платной.
При работе с блокнотом в левой части экрана расположен список загруженных источников, а в центре — чат-бот, анализирующий источники, с ним в первую очередь и взаимодействует пользователь. В чате можно проводить поиск и задавать смысловые вопросы о загруженных документах. Каждый ответ можно сохранить в виде заметки внутри блокнота, заметки можно превращать в новые источники.
В правой части экрана — так называемая «Студия», в которой пользователю предлагается пять автоматизированных методов для изучения документов в блокноте:
- «Краткий обзор»;
- «Методичка»;
- «Хронология»;
- «Часто задаваемые вопросы»;
- «Аудиопересказ».
«Краткий обзор» и «Методичка» — находка для студентов и преподавателей. Первый поможет выделить главное из одного или сразу всех файлов в блокноте. Вторая поможет разработать на их основе целый учебный курс: конспекты лекций, практические задания, темы эссе и вопросы для тестов. Мы опробовали эту функцию на книге Ханса Рослинга «Фактологичность» и за 7 сек. получили хорошо структурированный конспект лекции об этой книге с итоговой викториной для учащихся.
Пригодится эта функция и для расследований. Например, при эксперименте на данных о нескольких сайтах, которые подозреваются в распространении дезинформации в Казахстане и других странах, NotebookLM сгенерировал вполне верную методичку, по которой можно провести расследование, найти связи между сайтами и теоретически даже выйти на владельцев этой сети.
Схожим образом работает функция «Хронология»: она вычленяет даты и связанные с ними смысловые элементы, обнаруженные в блокноте. Отметим, что модель может ошибочно сопоставить дату и элемент, который просто упомянут в тексте поблизости. В таких случаях она запрограммирована делать оговорку, но лучше перепроверить самому.
Функция «Часто задаваемые вопросы» позволяет сгенерировать блок вопросов, которые, вероятно, могут возникнуть до или при прочтении содержимого блокнота. Модель, соответственно, найдёт на них ответы и покажет их пользователю.
«Аудиопересказ» — самая впечатляющая функция. Она позволяет сгенерировать на основе блокнота подкаст, причём сделать это на 50 языках, включая русский (язык можно выбрать в настройках). Беседу ведут два ИИ-персонажа — мужским и женским голосами. На английском они звучат очень естественно, на русском проскакивает неверное произношение слов, но качество анализа позволяет с этим смириться.
Рядом с кнопкой генерации подкаста есть кнопка «Настроить». Нажав на неё, вы сможете скорректировать детали подкаста и основные темы, которые будут обсуждать «ведущие», — нужно просто задать в промпте важные для вас параметры.

Предположим, вы анализируете финансовую документацию нескольких компаний за два года (а это могут быть десятки отчётов, на изучение которых придётся потратить дни) и вам нужно найти потенциальные свидетельства коррупции. Вы можете задать именно такое уточнение и получить аудиопересказ, сфокусированный на этой теме. Далее вы можете вновь переключиться в текстовый режим и проанализировать файлы, прошедшие предварительный отбор.
Буквально за пару дней до выхода этого материала функция аудиопересказа (пока только в режиме бета-тестирования и на английском языке) стала интерактивной. Теперь пользователь может принять участие в сгенерированной беседе. Нужно вмешаться в разговор «ведущих» подкаста и задать уточняющий вопрос — беседа пойдёт в нужном вам направлении (придётся немного подождать).
В бесплатной версии в каждом блокноте можно хранить только один аудиопересказ, но это не проблема — можно скачать сгенерированный файл, удалить пересказ из блокнота и задать промпт для генерации подкаста с новыми задачами. Скачанный файл при желании можно загрузить как один из источников.
Ограничения
- Каждый источник в блокноте может содержать не больше 500 000 слов и/или весить не больше 200 Мб.
- Это же ограничение касается и видео с субтитрами: файл с ними не должен превышать 500 000 слов. Впрочем, это не проблема: даже гости Юрия Дудя не в состоянии произнести столько слов за три часа интервью.
- В одном блокноте можно хранить до 1000 заметок.
- Удалённые заметки не восстанавливаются.
- На данный момент не поддерживаются таблицы (например, файлы в форматах XSLX и CSV), для анализа их придётся предварительно перевести в PDF.
- Синхронизация с Google Drive на май 2025 года тоже неполная — только документы и презентации.
- При анализе аудио инструмент не разбивает реплики по спикерам и не даёт тайм-коды.
Часть этих недостатков, вероятно, будет устранена в будущем. Так, логично предположить, что инструмент от Google должен однажды начать работать с Google Sheets, а также переносить тайм-коды из видео на YouTube. Но и в текущей конфигурации NotebookLM способен существенно сократить время на изучение большого массива данных. В бесплатной версии в рамках одного блокнота можно анализировать до 25 млн слов — это три полных 90-томных собрания сочинений Льва Толстого.





