视频选集

MarkItDown是一个轻量级的Python实用程序,用于将各种文件转换为Markdown,以用于LLMs和相关的文本分析管道。重点是保留重要的文档结构和内容作为Markdown (包括: 标题,列表,表格,链接等),而输出通常是合理的可呈现和人性化的,它应该被文本分析工具所使用,并且可能不是用于人类消费的高保真文档转换的最佳选择。
目前,MarkItDown支持:
PDF
PowerPoint
Word
Excel
Images (EXIF metadata and OCR)
Audio (EXIF metadata and speech transcription)
HTML
Text-based formats (CSV, JSON, XML)
ZIP files (iterates over contents)
Youtube URLs
EPubs
github:https://github.com/microsoft/markitdown/tree/main
兴河AI Assistent 还在改bug 哈哈 最终会放出来的~