您好,很感谢您的工作,我非常喜欢 请问 1. 为什么HotpotQA的部分env代码跟reflexion中不一样,在我运行的时候很容易发生死循环 ``` while True: try: observation = self.explorer.search(argument).strip('\n').strip() break except Exception as e: print(e) time.sleep(5) ``` 2. 另外,在运行react和reflexion的时候需要将`agent_type`指定吗,还是只用控制`agent.max_reflection_depth` 3. 在代码中是如何体现数据集的划分的呢,按照我的理解文章应该是有划分train set和eval set
您好,很感谢您的工作,我非常喜欢
请问
agent_type指定吗,还是只用控制agent.max_reflection_depth