Skip to content

water_in_the_text_check#676

Merged
HadronCollider merged 4 commits intomasterfrom
water_in_the_text_check
Apr 22, 2025
Merged

water_in_the_text_check#676
HadronCollider merged 4 commits intomasterfrom
water_in_the_text_check

Conversation

@Dariiiii
Copy link
Collaborator

@Dariiiii Dariiiii commented Apr 3, 2025

No description provided.

@github-actions github-actions bot added the has conflicts if new merge has conflicts label Apr 4, 2025
@github-actions github-actions bot removed the has conflicts if new merge has conflicts label Apr 10, 2025
@HadronCollider HadronCollider force-pushed the water_in_the_text_check branch from c9102ea to eb788d9 Compare April 10, 2025 12:52
@github-actions github-actions bot added the has conflicts if new merge has conflicts label Apr 10, 2025
Comment on lines +35 to +42
if self.watery_phrase_density(text, words) > self.watery_phrase_threshold:
result_str += f"В Разделе '{chapter['text']}' содержится более {self.watery_phrase_threshold*100}% 'водянистых' фраз.<br>"

if self.long_sentences_density(text) > self.long_sentence_threshold:
result_str += f"В разделе '{chapter['text']}' более {self.long_sentence_threshold*100}% предложений длиннее 20 слов.<br>"

if self.meaningful_word_density(words) < self.meaningful_word_threshold:
result_str += f"В разделе '{chapter['text']}' доля значимых слов составляет менее {self.meaningful_word_threshold*100}% от общего количества слов.<br>"
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Тут в фидбек нужно что-то похожее #647 (comment)

  1. вывести сами плохие фразы / слова, чтобы было понятно о чем речь (а не гадать где там и что)
  2. дать инструкцию что с этим сделать и как исправить

result_str += f"В Разделе '{chapter['text']}' содержится более {self.watery_phrase_threshold*100}% 'водянистых' фраз.<br>"

if self.long_sentences_density(text) > self.long_sentence_threshold:
result_str += f"В разделе '{chapter['text']}' более {self.long_sentence_threshold*100}% предложений длиннее 20 слов.<br>"
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

насколько "20 слов" могут (или должны) быть захардкоржены? Привязано ли это число к размеру long_sentence_threshold

@HadronCollider
Copy link
Collaborator

Устраните конфликты

@github-actions github-actions bot removed the has conflicts if new merge has conflicts label Apr 14, 2025
@HadronCollider HadronCollider merged commit 5bcf637 into master Apr 22, 2025
4 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants