Replace all Zep API calls in simulation endpoints with disk-first fallback

Extract shared helpers _load_disk_graph_data, _get_filtered_entities, _get_entity_by_uuid that try local graph_data.json before falling back to Zep Cloud API. Updates all 4 remaining Zep-dependent endpoints: entity listing, entity detail, entities by type, and profile generation.
2026-03-13 19:53:24 +07:00 · 2026-03-13 19:53:24 +07:00 · c9c1f44711
commit c9c1f44711
parent b17828807f
1 changed files with 87 additions and 63 deletions
--- a/backend/app/api/simulation.py
+++ b/backend/app/api/simulation.py
@ -20,6 +20,81 @@ from ..models.project import ProjectManager
 logger = get_logger('mirofish.api.simulation')
 def _load_disk_graph_data(graph_id: str):
    """Load graph data from disk by searching all projects for matching graph_id."""
    all_projects = ProjectManager.list_projects()
    for proj in all_projects:
        if proj.graph_id == graph_id:
            project_dir = ProjectManager._get_project_dir(proj.project_id)
            return LLMGraphBuilderService.load_graph_data(project_dir)
    return None
 def _get_filtered_entities(graph_id: str, entity_types=None, enrich=True):
    """Get filtered entities, trying disk first then Zep fallback."""
    disk_data = _load_disk_graph_data(graph_id)
    if disk_data:
        manager = SimulationManager()
        return manager._filter_entities_from_data(disk_data, entity_types)
    reader = ZepEntityReader()
    return reader.filter_defined_entities(
        graph_id=graph_id,
        defined_entity_types=entity_types,
        enrich_with_edges=enrich
    )
 def _get_entity_by_uuid(graph_id: str, entity_uuid: str):
    """Get a single entity by UUID, trying disk first then Zep fallback."""
    disk_data = _load_disk_graph_data(graph_id)
    if disk_data:
        from ..services.zep_entity_reader import EntityNode
        nodes = disk_data.get("nodes", [])
        edges = disk_data.get("edges", [])
        node_map = {n["uuid"]: n for n in nodes}
        node = node_map.get(entity_uuid)
        if not node:
            return None
        related_edges = []
        related_nodes = []
        for edge in edges:
            if edge.get("source_node_uuid") == entity_uuid or edge.get("target_node_uuid") == entity_uuid:
                related_edges.append({
                    "uuid": edge.get("uuid", ""),
                    "name": edge.get("name", ""),
                    "fact": edge.get("fact", ""),
                    "source_node_uuid": edge.get("source_node_uuid", ""),
                    "target_node_uuid": edge.get("target_node_uuid", ""),
                    "source_node_name": edge.get("source_node_name", ""),
                    "target_node_name": edge.get("target_node_name", ""),
                })
                other_uuid = (edge.get("target_node_uuid") if edge.get("source_node_uuid") == entity_uuid
                              else edge.get("source_node_uuid"))
                other_node = node_map.get(other_uuid)
                if other_node:
                    related_nodes.append({
                        "uuid": other_node.get("uuid", ""),
                        "name": other_node.get("name", ""),
                        "labels": other_node.get("labels", []),
                    })
        return EntityNode(
            uuid=entity_uuid,
            name=node.get("name", ""),
            labels=node.get("labels", []),
            summary=node.get("summary", ""),
            attributes=node.get("attributes", {}),
            related_edges=related_edges,
            related_nodes=related_nodes,
        )
    reader = ZepEntityReader()
    return reader.get_entity_with_context(graph_id, entity_uuid)
 # Interview prompt 优化前缀
 # 添加此前缀可以避免Agent调用工具，直接用文本回复
 INTERVIEW_PROMPT_PREFIX = "Based on your persona, all past memories and actions, respond directly with text without calling any tools: "
@ -57,25 +132,14 @@ def get_graph_entities(graph_id: str):
        enrich: 是否获取相关边信息（默认true）
    """
    try:
        if not Config.ZEP_API_KEY:
            return jsonify({
                "success": False,
                "error": "ZEP_API_KEY is not configured"
            }), 500
        entity_types_str = request.args.get('entity_types', '')
        entity_types = [t.strip() for t in entity_types_str.split(',') if t.strip()] if entity_types_str else None
        enrich = request.args.get('enrich', 'true').lower() == 'true'
-        
+
        logger.info(f"获取图谱实体: graph_id={graph_id}, entity_types={entity_types}, enrich={enrich}")
-        
+
-        reader = ZepEntityReader()
+        result = _get_filtered_entities(graph_id, entity_types, enrich)
-        result = reader.filter_defined_entities(
+
            graph_id=graph_id,
            defined_entity_types=entity_types,
            enrich_with_edges=enrich
        )
        return jsonify({
            "success": True,
            "data": result.to_dict()
@ -94,14 +158,7 @@ def get_graph_entities(graph_id: str):
 def get_entity_detail(graph_id: str, entity_uuid: str):
    """获取单个实体的详细信息"""
    try:
-        if not Config.ZEP_API_KEY:
+        entity = _get_entity_by_uuid(graph_id, entity_uuid)
            return jsonify({
                "success": False,
                "error": "ZEP_API_KEY is not configured"
            }), 500
        reader = ZepEntityReader()
        entity = reader.get_entity_with_context(graph_id, entity_uuid)
        if not entity:
            return jsonify({
@ -127,20 +184,10 @@ def get_entity_detail(graph_id: str, entity_uuid: str):
 def get_entities_by_type(graph_id: str, entity_type: str):
    """获取指定类型的所有实体"""
    try:
        if not Config.ZEP_API_KEY:
            return jsonify({
                "success": False,
                "error": "ZEP_API_KEY is not configured"
            }), 500
        enrich = request.args.get('enrich', 'true').lower() == 'true'
-        
+
-        reader = ZepEntityReader()
+        result = _get_filtered_entities(graph_id, [entity_type], enrich)
-        entities = reader.get_entities_by_type(
+        entities = result.entities
            graph_id=graph_id,
            entity_type=entity_type,
            enrich_with_edges=enrich
        )
        return jsonify({
            "success": True,
@ -473,27 +520,9 @@ def prepare_simulation():
        try:
            logger.info(f"同步获取实体数量: graph_id={state.graph_id}")
-            # Try disk-stored graph data first (LLM-built graphs)
+            filtered_preview = _get_filtered_entities(
-            disk_graph_data = None
+                state.graph_id, entity_types_list, enrich=False
-            all_projects = ProjectManager.list_projects()
+            )
            for proj in all_projects:
                if proj.graph_id == state.graph_id:
                    project_dir = ProjectManager._get_project_dir(proj.project_id)
                    disk_graph_data = LLMGraphBuilderService.load_graph_data(project_dir)
                    break
            if disk_graph_data:
                manager = SimulationManager()
                filtered_preview = manager._filter_entities_from_data(
                    disk_graph_data, entity_types_list
                )
            else:
                reader = ZepEntityReader()
                filtered_preview = reader.filter_defined_entities(
                    graph_id=state.graph_id,
                    defined_entity_types=entity_types_list,
                    enrich_with_edges=False
                )
            state.entities_count = filtered_preview.filtered_count
            state.entity_types = list(filtered_preview.entity_types)
@ -1412,12 +1441,7 @@ def generate_profiles():
        use_llm = data.get('use_llm', True)
        platform = data.get('platform', 'reddit')
-        reader = ZepEntityReader()
+        filtered = _get_filtered_entities(graph_id, entity_types, enrich=True)
        filtered = reader.filter_defined_entities(
            graph_id=graph_id,
            defined_entity_types=entity_types,
            enrich_with_edges=True
        )
        if filtered.filtered_count == 0:
            return jsonify({