¡Hola! Recientemente hemos lanzado SymptomCheck Bench, un banco de pruebas de código abierto para probar la precisión diagnóstica de los agentes de IA médica en entornos conversacionales. Nos encantaría que lo incluyeran en su colección.
Nuestro banco de pruebas simula las interacciones entre médicos y pacientes mediante la simulación de pacientes basada en LLM y se centra específicamente en la evaluación de aplicaciones de verificación de síntomas. A diferencia de los bancos de pruebas estáticos tradicionales, prueba la capacidad del agente para recopilar información a través de una conversación antes de realizar un diagnóstico.
Puede encontrar más detalles aquí:
Blog: https://medask.tech/blogs/introducing-symptomcheck-bench/
GitHub: https://github.com/medaks/symptomcheck-bench
Avíseme si necesita información adicional.
¡Hola! Recientemente hemos lanzado SymptomCheck Bench, un banco de pruebas de código abierto para probar la precisión diagnóstica de los agentes de IA médica en entornos conversacionales. Nos encantaría que lo incluyeran en su colección.
Nuestro banco de pruebas simula las interacciones entre médicos y pacientes mediante la simulación de pacientes basada en LLM y se centra específicamente en la evaluación de aplicaciones de verificación de síntomas. A diferencia de los bancos de pruebas estáticos tradicionales, prueba la capacidad del agente para recopilar información a través de una conversación antes de realizar un diagnóstico.
Puede encontrar más detalles aquí:
Blog: https://medask.tech/blogs/introducing-symptomcheck-bench/
GitHub: https://github.com/medaks/symptomcheck-bench
Avíseme si necesita información adicional.