V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
miantiao
V2EX  ›  分享创造

套壳 MarkItDown - 在浏览器内将 Office 文件转为 Markdown

  •  1
     
  •   miantiao · 8 天前 · 1283 次点击

    微软开源了一个 Python 项目 MarkItDown

    可以将 Office 文件转换为 Markdown ,一天之内涨了快 10k ⭐ 。

    由于是 Python 实现需要服务端,官方没提供在线示例。

    我找到一个可以在浏览器内运行的方法,可以将 Office 文件或其他基于文本类的文件转换为干净的 Markdown 。

    基于微软开源的 MarkItDown ,完全在浏览器内运行,使用需要网络通畅。

    不上传文件到服务器,可放心使用。

    https://www.html.zone/markitdown/

    markitdown

    10 条回复    2024-12-19 16:14:28 +08:00
    id7368
        1
    id7368  
       8 天前 via iPhone
    这域名不错🤓
    bxb100
        2
    bxb100  
       8 天前
    一看果然 wasm
    metalvest
        3
    metalvest  
       8 天前 via Android
    rustpython 转 wasm ?
    dcsuibian
        4
    dcsuibian  
       8 天前
    我正好想要反着的
    lamquan
        5
    lamquan  
       8 天前
    扫描版的 PDF 处理不了
    miantiao
        6
    miantiao  
    OP
       8 天前
    @bxb100 是的,WASM 可以运行一个操作系统了
    @metalvest cpython
    HuberyPang
        7
    HuberyPang  
       7 天前
    不错 这个转换后是不是用个托管静态的服务就能运行,比如 vervel 项目开源吗, 学习下
    mayun
        8
    mayun  
       7 天前
    好像没找到官方的文档。只有个 repo
    guet
        9
    guet  
       6 天前
    @mayun https://markitdown-docs.vercel.app/ 不过貌似是第三方的,倒是示例代码还算全
    Visoar
        10
    Visoar  
       6 天前

    报错信息貌似可以处理一下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1177 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 18:16 · PVG 02:16 · LAX 10:16 · JFK 13:16
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.