Новинка
Аннотация
DeepSeek — это генеративная модель ИИ с открытым исходным кодом, основанная на архитектуре Transformer и объединяющая передовые технологии, такие как архитектура MoE, обучение с переменной разрядностью и распределенная оптимизация. Она демонстрирует хорошие результаты в области генерации текста, мультимодальной обработки и адаптации под конкретные задачи при удивительно низкой стоимости обучения. В этой книге описаны особенности глубоко оптимизированной архитектуры DeepSeek-V3 и способы применения модели на практике.
Книга будет полезна исследователям технологий генеративного ИИ, инженерам-разработчикам программного обеспечения, специалистам по обработке данных, а также всем желающим быстро освоить практическое применение больших языковых моделей.
Книга будет полезна исследователям технологий генеративного ИИ, инженерам-разработчикам программного обеспечения, специалистам по обработке данных, а также всем желающим быстро освоить практическое применение больших языковых моделей.
Характеристики
|
Издано
|
Издательство «ДМК Пресс» |
|
Формат(ы)
|
|
|
Перевод
|
с кит. |
|
Переводчик(и)
|
В.С. Яценков |
|
Вид издания
|
Практическое издание |
Ознакомительный фрагмент
Открыть/скачать фрагмент
364,1 кб
Отзывы
