feature: alethe parser #69

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Open

GuilhermeLLS wants to merge 8 commits into ufmg-smite:main from GuilhermeLLS:feature/alethe-parser

Collaborator

GuilhermeLLS commented Jun 23, 2023 •

edited

Loading

Esse Pull Request tem como principal finalidade adicionar um parser de demonstrações no formato Alethe à aplicação.
Além disso, também consertei todos os testes da aplicação e adicionei testes para p novo parser Alethe.

Escreverei mais explicações sobre o código nos comentários abaixo.

GuilhermeLLS added 8 commits

June 23, 2023 15:24


          feat: initial iteration on alethe parser

7a472e8


          feat: update reducer to pick correct parser

d2b5ee4


          feat: add alethe to visualizerdialog file extensions

0e1fe4c


          Merge branch 'ufmg-smite:main' into feature/alethe-parser

291fb2f


          refactor: update reducer to receive file extension as param

c91e5d8


          fix: update type to use omit instead of Pick

389696b


          refactor: update alethe identifiers and regexs

876f952


          test: fix all App tests + added tests for processAlethe

c9b49ae

GuilhermeLLS requested a review from vinciusb

June 24, 2023 14:03

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

+                  const aletheIdToNodeId = new Map<string, number>();
+                  const preProcNodes: PreProccessedNodeInterface[] = [];
+                  const parsedProof = aletheProof.split('\n').reverse().filter(filterUndesiredLines);

Collaborator Author

GuilhermeLLS Jun 24, 2023

aqui eu quebro a string por linha (\n), inverto o array resultante e filtro algumas linhas.

Quebro a string por linha, pois iremos fazer o parse de linha a linha da demonstrações.
Inverto o array, pois demonstrações no formato Alethe possuem em sua última linha, a conclusão da prova, ou seja, o nó Raiz do Grafo. Portanto, inicio o parse de trás para frente.
As linhas filtradas são linhas vazias '' e linhas que possuam o identificador anchor. O identificador anchor existe para indicar em qual passo da demonstração se iniciará a formação de um subgrafo. Não necessitamos saber disso, pois existe uma forma mais eficiente de se identificar um subgrafo na demonstração (linha 141)

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

Comment on lines +134 to +138

+                          const conclusion = findEnclosedText(line, aletheId).slice(2).trim();
+                          const rule = parseRule(line);
+                          const premises = findEnclosedText(line, ALETHE_IDENTIFIERS.premises);
+                          const args = findEnclosedText(line, ALETHE_IDENTIFIERS.arguments);
+                          const discharge = findEnclosedText(line, ALETHE_IDENTIFIERS.discharge);

Collaborator Author

GuilhermeLLS Jun 24, 2023

aqui faço o parse dos identificadores alethe existentes em demonstrações. Utilizo uma função especial para fazer o parse da cláusula de rule, pois a estratégia aplicada para as demais cláusulas nem sempre funciona.

a função findEnclosedText retorna o texto entre parênteses que ocorre a partir de um identificador específico (segundo argumento da função).

já a função parseRule utiliza expressões regulares para fazer o parse das regras.

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

Comment on lines +132 to +133

		const aletheId = parseAletheId(line);
		aletheIdToNodeId.set(aletheId, index);

Collaborator Author

GuilhermeLLS Jun 24, 2023

linhas em demonstrações Alethe também possuem identificadores. Eu poderia utilizá-los na prova, porém para manter o padrão da aplicação, utilizei um índice único gerado durante o parse para identificá-los.

Salvamos o aletheId em um Map, para que no futuro consigamos achar a referência desse identificador alethe com o identificador gerado que o representa na prova.

Isso é necessário para a parte de encontrarmos os nós de filho de cada nó parseado.

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

+                          const args = findEnclosedText(line, ALETHE_IDENTIFIERS.arguments);
+                          const discharge = findEnclosedText(line, ALETHE_IDENTIFIERS.discharge);
+                          // children must be resolved by the end of the loop, because by then we will have all the alethe nodes parsed and therefore the currting below will not return undefined
+                          const children = premises ? premises.split(' ').map((premise) => () => aletheIdToNodeId.get(premise)) : [];

Collaborator Author

GuilhermeLLS Jun 24, 2023

a cláusula :premises indica quais são os filhos diretos daquele nó. Equivale ao X -> Y em demonstrações .dot.

Dessa forma, checamos se existem filhos para o nó que está sendo parseado, e caso existam, executamos um split na string, para que tenhamos um array de strings em que cada elemento é uma child.

Após isso, executamos a high order function .map para cada elemento desse array, que acaba retornando um callback que retorna o elemento da estrutura de dadosMap. Utilizamos um callback nesse caso, pois, como a prova é lida de trás para frente, é possível que o nó criança que está sendo "procurado" ainda não foi inserido dentro do Map.

Portanto, apenas quando acabamos o parse da demonstração por completo, resolvemos os nós criança dela.

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

Comment on lines +141 to +144

+                          if (rule === 'subproof') {
+                              // if current node has rule of type subproof, then the next node is it's immediate child
+                              children.push(() => index + 1);
+                          }

Collaborator Author

GuilhermeLLS Jun 24, 2023

se o nó atual tem a regra subproof, significa que a próxima linha imediata será seu filho.

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

+                              id: index,
+                              conclusion: conclusion,
+                              rule: rule,
+                              args: joinStrings(args, discharge),

Collaborator Author

GuilhermeLLS Jun 24, 2023

as cláusulas :args e :discharge representam os argumentos de um nó

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

Comment on lines +156 to +159

+                      } else if (isAssumeLine(line)) {
+                          const aletheId = line.match(/assume(.*?)\(/)?.[1].trim() || '';
+                          aletheIdToNodeId.set(aletheId, index);
+                          const conclusion = line.slice(line.indexOf(aletheId) + aletheId.length + 1, -1).trim();

Collaborator Author

GuilhermeLLS Jun 24, 2023

para linhas com a cláusula assume, fazemos um parse diferente, pois elas representam nós folha, ou seja, que não tem filhos.

Dessa forma, eles indicam apenas a declaração de uma expressão.

GuilhermeLLS commented

View reviewed changes

frontend/src/store/features/proof/auxi.ts

Comment on lines +174 to +190

+                  preProcNodes.forEach((node) => {
+                      const children = node.children.map((child) => child()).filter(nonNullable);
+                      nodes.push({ ...node, children });
+                  });
+                  // here, we resolved the parents. Now we can resolve the descendants.
+                  nodes.forEach((node) => {
+                      const parents = nodes.reduce<number[]>((acc, curr) => {
+                          if (curr.children.includes(node.id)) acc.push(curr.id);
+                          return acc;
+                      }, []);
+                      node.parents = parents;
+                  });
+                  // resolved the descendants.
+                  nodes.forEach((node) => {
+                      const desc = findDescendants(nodes, node.id);
+                      node.descendants = desc.length;
+                  });

Collaborator Author

GuilhermeLLS Jun 24, 2023

nos 3 loops ocorrem processos interessantes:

No primeiro, resolvemos os nós folha de cada nó, invocando o callback criado anteriormente para cada. Além disso, é necessário o filter(nonNullable) por questão de segurança de tipos. O Typescript na versão do projeto, sempre que executamos um filter em cima de um array que é do tipo (number | undefined)[], ele sempre retornará (number | undefined)[], mesmo que filtremos explicitamente elementos do tipo undefined. A função nonNullableexecuta um filtro direto e também um type assertion em seu retorno, para que nosso array de children seja do tipo number[]`.
No segundo laço, resolvemos os pais de cada nó do grafo. Isso é feito percorrendo toda a árvore e checando se o array de children de cada nó possui o nó específico que estamos procurando. Inclusive, é por isso, que só podemos resolver os pais depois de resolver os filhos.
No terceiro laço, encontramos a quantidade de descendentes de um nó.Isso é feito através da função findDescendants. A findDescendants é uma função recursiva, em que procuramos em todos os filhos de um nó a partir de um nó específico, ou seja, ao invocarmos essa função para cada nó da árvore, no fim, conseguiremos a quantidade de descendentes de todos.

GuilhermeLLS marked this pull request as ready for review

June 24, 2023 14:38

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet