added research jn by molivka · Pull Request #140 · BaldiSlayer/rofl-lab1

molivka · 2024-12-07T15:25:22Z

No description provided.

stewkk · 2024-12-09T16:36:46Z

Запушил pre-commit хук с jupytext, чтобы в PR нормально дифф можно было смотреть =)

+ настроил CI, чтобы .py и .ipynb файлы синхронизировались автоматически

TonitaN · 2024-12-17T05:49:13Z

LLM/research/research.ipynb

+    "### Как считаю метрику?\n",
+    "Беру два вопроса: пользовательский и из базы знаний, привожу их к одному виду (прописные буквы, начальная форма, удаление стоп слов), потом считаю пересечение и делю на количество слов в вопросе из БЗ.\n",
+    "\n",
+    "**Улчушение**: для каждого слова определить его важность: как количество вхождений в БЗ, либо ручками составить словарь с важными терминами."


Если зафиксировать дисциплину заполнения БЗ, то можно и не ручками. Например, потребовать, чтобы все важнейшие понятия в вопросе и ответе из БЗ помечались каким-то emph-форматом (в случае использования англ модели - приводить в скобках перевод). Тогда дальше можно извлекать термины из вопроса-ответа автоматически, тем самым создавая список ключевых слов. И с ними соотносить фразы из запроса.
Плюс добавить в CI линт на то, что в элементах БЗ обязательно есть эти выделенные слова. Конечно, выявлять адекватность ключевых слов - уже задача ревьюера, но хотя бы не придётся дважды делать одну и ту же работу (сначала ревью БЗ, а потом по мотивам БЗ составление словаря).

Плюс добавить в CI линт

~~памагите~~

molivka · 2024-12-21T21:18:26Z

я посмотрела на варианты решений проблемы с близкими, и мне показалось, что обучить w2v будет хорошей идеей, но пока 0, тк я где-то ошиблась и всё обучается не так, как надо
поэтому лучше не радоваться результатам (если кто-то будет пристально смотреть ноутбук)

added jn

198447a

stewkk force-pushed the research branch from 78512f6 to a2dc23c Compare December 9, 2024 16:24

Configure jupytext

56804e0

stewkk force-pushed the research branch from 72b62a5 to 56804e0 Compare December 9, 2024 16:26

TonitaN reviewed Dec 17, 2024

View reviewed changes

TonitaN mentioned this pull request Dec 17, 2024

Затыкание дыр в БЗ #79

Open

molivka and others added 3 commits December 21, 2024 23:39

жалкие попытки что-то исправить

3eaaa1d

i'm stupid, you know...

2bab873

Apply pre-commit changes

25dfd0b

molivka and others added 4 commits December 22, 2024 10:59

added doc2vec

14069d3

Apply pre-commit changes

a95a7d0

added new v. model

4ea6249

Apply pre-commit changes

7782194

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

added research jn#140

added research jn#140
molivka wants to merge 9 commits intomainfrom
research

molivka commented Dec 7, 2024

Uh oh!

stewkk commented Dec 9, 2024 •

edited

Loading

Uh oh!

TonitaN Dec 17, 2024

Uh oh!

BaldiSlayer Dec 17, 2024

Uh oh!

molivka commented Dec 21, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

Conversation

molivka commented Dec 7, 2024

Uh oh!

stewkk commented Dec 9, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

TonitaN Dec 17, 2024

Choose a reason for hiding this comment

Uh oh!

BaldiSlayer Dec 17, 2024

Choose a reason for hiding this comment

Uh oh!

molivka commented Dec 21, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

stewkk commented Dec 9, 2024 •

edited

Loading