|
|
|
|
DeepSeek в действии
Яценков В.С.
Код: 44519919
Страниц: 404
Переплет: твердый Иллюстрации: цветные иллюстрации Бумага: офсетная Язык издания: русский Год издания: 2025 Возрастные ограничения: 16+ Размер: 13.5 x 21.5 x 3 см
Вес: 776 г.
ISBN: 978-5-93700-396-6
Наличие: распродано
|
Описание:
DeepSeek – это генеративная модель искусственного интеллекта с открытым исходным кодом, основанная на архитектуре Transformer и объединяющая передовые технологии, такие как архитектура MoE, обучение с переменной разрядностью и распределенная оптимизация. Она хорошо зарекомендовала себя в области генерации текста, мультимодальной обработки и адаптации под конкретные прикладные задачи. В книге описаны особенности глубоко оптимизированной архитектуры DeepSeek-V3 и способы применения модели на практике.
Рассматриваемые темы:
Теоретические основы – базовая архитектура и технологии обучения моделей типа Transformer, механизм внимания DeepSeek, законы масштабирования и их применение в оптимизации моделей.
Основные приемы работы – начало работы с моделью, знакомство с API, реализация диалога, функции обратного вывода, кеширование на диске и оптимизация кеша.
Расширенное применение – реализация чат-клиентов, интеллектуальных помощников, плагинов VS Code и т. Д.
Книга будет полезна исследователям технологий генеративного ИИ, инженерам-разработчикам программного обеспечения, специалистам по обработке данных, а также всем желающим быстро освоить практическое применение больших языковых моделей.
Издание подготовлено «Лабораторией искусственного интеллекта будущего» (Китай). Коллектив лаборатории состоит из докторов и магистров ведущих китайских университетов, специализирующихся на разработке и инновациях в области обработки естественного языка, глубокого обучения, компьютерного зрения и мультимодальных моделей.
|
|
|
|
|