Skip to content

MRZHUH/mcp-markitdown-base

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

MCP MarkitDown Base

这是一个基于 MarkItDown 库的 MCP (Multi-Agent Communication Protocol) 服务,用于将各种文件格式转换为 Markdown 文本。

功能

  • 将指定文件转换为 Markdown 格式的文本。
  • 支持多种文件格式,包括 PDF、PowerPoint、Word、Excel、Images (EXIF metadata and OCR)、Audio (EXIF metadata and speech transcription)、HTML、Text-based formats (CSV, JSON, XML)、ZIP files (iterates over contents)、Youtube URLs、EPubs。
  • 可选择将转换后的 Markdown 文本保存到指定路径。

安装

  1. 克隆仓库:

    git clone https://gitee.com/mcp-markitdown-base.git

使用

该服务通过 MCP 协议提供 convertFileToMarkdown 工具。您可以通过 MCP 客户端调用此工具。

convertFileToMarkdown 工具

  • 描述:根据传入的文件路径,将文件转换为 markdown 格式,并返回转换后的 markdown 文本。
  • 参数
    • file (str): 文件路径,根据系统写绝对路径。
    • resultPath (str): 转换后的 markdown 文本保存路径,默认传入空字符串 "" 即可。如果明确要求路径则根据系统写绝对路径。

示例 (通过 MCP 客户端调用)

MCP 客户端配置示例(Windows) 以下是一个 MCP 客户端的配置示例,用于启动此服务:

{
   "mcpServers": {
     "mcp-markitdown-base": {
       "command": "uv",
       "args": [
         "run",
         "--directory",
         "E:\\mcp-markitdown-base",
         "main.py"
       ]
     }
   }
}

请将 E:\\mcp-markitdown-base 替换为您的项目实际路径,并确保路径中的反斜杠 \ 已正确转义为 \\

About

这是一个基于 `MarkItDown` 库的 MCP (Multi-Agent Communication Protocol) 服务,用于将各种文件格式转换为 Markdown 文本。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages