Skip to content

khoshov/llm-course

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Курс по Большим Языковым Моделям (LLM)

Комплексный курс по изучению больших языковых моделей - от базовых концепций до практического применения.

🗺️ Карта обучения

🔰 Начальный уровень: Основы

Для тех, кто только знакомится с LLM

  1. 📋 Что нужно знать заранее? (5 минут)

    • Проверка готовности к изучению
  2. 📚 Словарь терминов (15 минут)

    • Основные понятия простыми словами
  3. ⚙️ Как работают трансформеры? (30 минут)

    • Техническая основа всех современных LLM
    • Механизм внимания и архитектура
  4. 🧠 BERT vs GPT: в чем разница? (45 минут)

    • Два подхода к языковым моделям
    • Токенизация и эмбеддинги

🎓 Средний уровень: Обучение и применение

Когда уже понятны основы

  1. 🎯 Как обучают современные LLM? (50 минут)

    • От предобучения до чат-моделей
    • SFT, RLHF, LoRA и эффективные методы
  2. 🌐 Какие модели выбрать? (40 минут)

    • Обзор закрытых и открытых моделей
    • Критерии выбора под задачу
  3. 🚀 История развития: от T5 до ChatGPT (55 минут)

    • Эволюция моделей и ключевые прорывы
    • Возникающие способности и масштабирование

🏗️ Продвинутый уровень: Техническая глубина

Для тех, кто хочет понять детали

  1. 🔬 Как обучают модели с нуля? (60 минут)

    • Предтренинг, данные, законы масштабирования
    • Технические оптимизации и ускорения
  2. ⚡ Как сделать модели быстрее? (45 минут)

    • Дистилляция и квантование
    • Практические техники оптимизации
  3. 🛡️ Безопасность и точность ответов (50 минут)

    • Выравнивание моделей с человеческими ценностями
    • RAG для точных и актуальных ответов

🎯 Кому подходит этот курс?

👥 Целевая аудитория:

  • 🔰 Новички в ML - курс написан понятным языком с объяснениями
  • 💻 Разработчики - хотят понять, как работают современные LLM
  • 📊 Аналитики - работают с ИИ-продуктами и нужно понимать технологию
  • 🎓 Студенты - изучают машинное обучение или смежные области
  • 🏢 Менеджеры - принимают решения по ИИ-проектам

🆕 Полный новичок? Начните здесь:

  1. 📋 Проверьте готовность - что нужно знать заранее (5 минут)
  2. 📚 Изучите глоссарий - основные термины простыми словами (15 минут)
  3. 🚀 Начните с основ - как работают трансформеры (30 минут)

🗂️ Альтернативные пути изучения

🚀 "Хочу быстро понять суть" (2 часа)

  1. 📚 Глоссарий - термины (15 мин)
  2. 🧠 BERT vs GPT - основные подходы (45 мин)
  3. 🌐 Обзор моделей - что выбрать (40 мин)
  4. 🎯 Обучение моделей - как делают ChatGPT (20 мин из 50)

🔧 "Хочу применять на практике" (3 часа)

  1. 📚 Глоссарий + 🧠 BERT vs GPT (1 час)
  2. 🎯 Обучение моделей - фокус на LoRA/QLoRA (50 мин)
  3. 🌐 Выбор моделей (40 мин)
  4. ⚡ Оптимизация (45 мин)

🎓 "Хочу стать экспертом" (6+ часов)

Изучайте в рекомендованном порядке, углубляясь во все детали.


🧩 Модули курса по темам

🏗️ Архитектура и основы

🎓 Обучение и дообучение

🌐 Практическое применение

📖 История и контекст


🔧 Как использовать этот курс

📖 Структура материалов:

  • Краткое введение с мотивацией
  • Содержание для быстрой навигации
  • Ключевые концепции с аналогиями
  • Практические примеры и ссылки
  • Вопросы для самопроверки

⏱️ Временные затраты:

  • 🔰 Базовое понимание: 2-3 часа
  • 🎓 Рабочие знания: 4-5 часов
  • 🏗️ Глубокая экспертиза: 6-8 часов

💡 Советы по изучению:

  1. Не спешите - лучше понять меньше, но глубже
  2. Экспериментируйте с реальными моделями по ходу изучения
  3. Возвращайтесь к глоссарию когда встречаете непонятные термины
  4. Изучайте в удобном темпе - можно растянуть на недели

🚀 Ключевые концепции курса

🧠 Основы ИИ

  • Трансформеры - архитектура современных моделей
  • Внимание (Attention) - как модели фокусируются на важном
  • Токенизация - превращение текста в числа

🎓 Обучение

  • Предобучение - изучение языка на огромных данных
  • Дообучение - адаптация под конкретные задачи
  • RLHF - обучение на основе человеческой обратной связи

🛠️ Практика

  • LoRA/QLoRA - эффективная адаптация моделей
  • RAG - поиск информации для точных ответов
  • Квантование - сжатие моделей для экономии ресурсов

📝 Обозначения и иконки

Иконка Значение Примеры
🔰 Для новичков Простые объяснения, аналогии
🎓 Средний уровень Технические детали
🏗️ Продвинутый Сложные концепции
⏱️ Время изучения 30 минут, 1 час
💡 Практические советы Что попробовать
🤔 Простыми словами Объяснение через аналогии
🚨 Частые ошибки Чего избегать

Курс создан для практического изучения современных языковых моделей с акцентом на понимание принципов работы и возможности применения. Удачного изучения! 🎉

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published