Skip to content

Hemos lanzado SymptomCheck Bench #3

@klemenvod

Description

@klemenvod

¡Hola! Recientemente hemos lanzado SymptomCheck Bench, un banco de pruebas de código abierto para probar la precisión diagnóstica de los agentes de IA médica en entornos conversacionales. Nos encantaría que lo incluyeran en su colección.

Nuestro banco de pruebas simula las interacciones entre médicos y pacientes mediante la simulación de pacientes basada en LLM y se centra específicamente en la evaluación de aplicaciones de verificación de síntomas. A diferencia de los bancos de pruebas estáticos tradicionales, prueba la capacidad del agente para recopilar información a través de una conversación antes de realizar un diagnóstico.

Puede encontrar más detalles aquí:

Blog: https://medask.tech/blogs/introducing-symptomcheck-bench/
GitHub: https://github.com/medaks/symptomcheck-bench

Avíseme si necesita información adicional.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions