V2EX gladlyknow
 gladlyknow's recent timeline updates
gladlyknow

gladlyknow

V2EX member #732080, joined on 2025-01-22 16:18:32 +08:00
gladlyknow's recent replies
19 days ago
Replied to a topic by LeviMarvin 程序员 PDF 编辑技术很难吗?
各位 V 友,

翻译 PDF 最痛苦的不是翻译本身,而是“格式崩溃”和“不可干预”。市面上大多数翻译工具都是上传 PDF 直接出一份不可修改的译文,遇到公式、表格错位或者 AI 抽风翻译错词,用户基本无计可施。

为了解决这个问题,我做了一个在线 PDF 翻译工具:onlinepdftranslator.com

技术栈与思路
我没有采用传统的“直出”方案,而是引入了 Markdown 作为中间层:

解析层:利用结构化 Vision-Language 模型将 PDF/图片解析为带格式的 JSON ,自动识别标题、段落、表格。

存储层:所有解析出的图片资源自动落盘到 Cloudflare R2 ,解决百度云域名限制及访问速度问题。

翻译层:接入顶级 LLM (支持普通/专业翻译双模式),对结构化文本进行分段翻译。

编辑层(核心):前端集成 Milkdown 渲染。我选型 Milkdown 是看中了它的插件化能力和对表格、公式的友好支持。用户可以直接在“所见即所得”的 Markdown 编辑器里进行微调。

渲染层:基于 Cloudflare Browser Rendering API ,通过 headless Chrome 实例将最终的 HTML/CSS 打印成高保真 PDF ,规避了 jsPDF 等前端库处理中文和分页时的各种坑。

工具亮点
全栈 Serverless:前后端一体化部署在 Cloudflare Workers 上,响应速度极快。

Markdown 控制权:支持直接导出 MD 文件,或者在编辑器里调整好格式后再导出 PDF/Doc/Excel 。

表格 & 公式友好:针对学术论文和技术文档,支持 LaTeX 实时渲染和复杂的表格编辑插件。

多种导出:除了常规 PDF ,还可以基于原始 JSON 的表格节点,直接生成带样式的 Excel 结构,不丢失单元格属性。

访问地址
onlinepdftranslator.com

目前项目处于持续迭代中,非常欢迎各位 V 友试用并提出技术建议。特别是关于在 Workers 环境下处理大规模二进制文件导出、以及 Milkdown 插件定制方面的经验,欢迎交流!
About     Help     Advertise     Blog     API     FAQ     Solana     3261 Online   Highest 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 13ms UTC 11:34 PVG 19:34 LAX 04:34 JFK 07:34
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86