rust-wic

Implementação de "Words in Context" do livro "Exercises in programming style" por Crista Lopes.

Instruções

Navegue ao diretório "data/" e atualize os arquivos "input.txt" e "stopwords.txt" como desejado.

"input.txt": O texto original em que o algoritmo percorrerá. O algoritmo separa esse texto em "frases", as quais sempre começam em uma letra maiúscula e terminam na próxima letra maiúscula (ou o término do arquivo).
"stopwords.txt": Uma lista de stopwords que serão ignoradas no processamento. Cada palavra é separada por whitespace, e todas serão lidas como minúsculas.

Feito isso, use cargo run no diretório principal. O resultado irá aparecer no console.

O resultado estará ordenado em ordem alfabética de keywords, e em seguida ordem alfabética de frases. O contexto recolhe duas palavras antes e depois da keyword, no formato key depois ... antes. O uso de reticências ... indica que palavras foram omitidas na mudança de contexto posterior à palavra para contexto anterior a ela.

Warning

Ambos os arquivos não aceitam diacríticos nem caracteres especiais. Evite utilizar pontuação.

Dependências:

cargo: "1.87.0"
- actix: "0.13.5"
- tokio: "1.45.1"
input padrão:
- No Meio do Caminho (1928) — Carlos Drummond de Andrade
- Canção do Exílio (1843) — Gonçalvez Dias
stopwords padrão: (fergiemcdowall_stopwords_pt)[https://github.com/stopwords-iso/stopwords-pt/blob/master/raw/fergiemcdowall_stopwords_pt.txt] (adaptado)

Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
data		data
src		src
.gitignore		.gitignore
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rust-wic

Instruções

Dependências:

About

Uh oh!

Releases

Contributors 3

Uh oh!

Languages

License

dede6giu/rust-wic

Folders and files

Latest commit

History

Repository files navigation

rust-wic

Instruções

Dependências:

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Contributors 3

Uh oh!

Languages