登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
纯 C#实现+AOT 打造的智能PDF目录提取工具 PdfTocExtrac ...
纯 C#实现+AOT 打造的智能PDF目录提取工具 PdfTocExtractor
[ 复制链接 ]
橘芜
2025-8-20 09:35:06
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
前言
最近在做标书的时候发现,有些文档文字量很大,想让大模型完全解读不太现实,先不说 context 长度够不够,首先 token 消耗量就爆炸了
于是想到使用取巧的方式,提取 PDF 的目录来进行分析,于是说干就干,用 C# 写了一个工具来实现目录提取,结果效果还不错
后续我又继续完善这个工具,增加了语义识别等功能
继续沿用 C# + AOT + GitHub Actions + dotnet tool + nuget 这套流程的开发
项目地址: https://github.com/star-plan/pdf-toc-extractor
类似项目:
SharpIco
ImageGlider
为什么是目录提取?
PDF 转 word、markdown 等格式的工具太多了
咱不卷这个赛道
<blockquote>
(说是这么说,我最近也做了一个
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
实现
AOT
打造
智能
PDF
相关帖子
在PySide6/PyQt6的项目中实现样式切换处理
具身智能——机械臂全解析:从技术原理到产业生态,解锁智能执行新范式
LRC/PDF泛目录站群重制版
在java中实现c#的int.TryParse方法
权威盘点:2025年中国智能舆情监控系统市场深度解析
HiAgent vs Coze:企业级智能体平台大对比
剑指offer-48、不使⽤加减乘除实现加法
flex里的小众元素实现方式
如何实现 vxe-tree 树组件拖拽节点后进行二次确认提示
基于LangGraph开发复杂智能体学习一则
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
在PySide6/PyQt6的项目中实现样式切换处理
0
321
全愉婉
2025-12-08
业界
具身智能——机械臂全解析:从技术原理到产业生态,解锁智能执行新范式
0
18
届表
2025-12-08
程序
LRC/PDF泛目录站群重制版
0
20
新程序
2025-12-08
安全
在java中实现c#的int.TryParse方法
0
799
歇凛尾
2025-12-09
安全
权威盘点:2025年中国智能舆情监控系统市场深度解析
0
308
段一璇
2025-12-10
业界
HiAgent vs Coze:企业级智能体平台大对比
0
574
巫雪艷
2025-12-10
安全
剑指offer-48、不使⽤加减乘除实现加法
0
377
每捎京
2025-12-10
安全
flex里的小众元素实现方式
0
210
皇甫佳文
2025-12-10
代码
如何实现 vxe-tree 树组件拖拽节点后进行二次确认提示
0
149
啪炽
2025-12-10
业界
基于LangGraph开发复杂智能体学习一则
0
691
鞠古香
2025-12-10
回复
(1)
祖柔惠
3 小时前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
热心回复!
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
安全
签约作者
程序园优秀签约作者
发帖
橘芜
3 小时前
关注
0
粉丝关注
22
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9994893
kk14977
6845356
3934307807
991122
4
xiangqian
638210
5
宋子
9984
6
闰咄阅
9991
7
刎唇
9993
8
俞瑛瑶
9998
9
蓬森莉
9951
10
匝抽
9986
查看更多