Hemos lanzado SymptomCheck Bench

¡Hola! Recientemente hemos lanzado SymptomCheck Bench, un banco de pruebas de código abierto para probar la precisión diagnóstica de los agentes de IA médica en entornos conversacionales. Nos encantaría que lo incluyeran en su colección.

Nuestro banco de pruebas simula las interacciones entre médicos y pacientes mediante la simulación de pacientes basada en LLM y se centra específicamente en la evaluación de aplicaciones de verificación de síntomas. A diferencia de los bancos de pruebas estáticos tradicionales, prueba la capacidad del agente para recopilar información a través de una conversación antes de realizar un diagnóstico.

Puede encontrar más detalles aquí:

Blog: https://medask.tech/blogs/introducing-symptomcheck-bench/
GitHub: https://github.com/medaks/symptomcheck-bench

Avíseme si necesita información adicional.


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Hemos lanzado SymptomCheck Bench #3

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Hemos lanzado SymptomCheck Bench #3

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions