分享一个超实用的浏览器插件:一键提取网页表格数据 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
Fechin
V2EX    分享创造

分享一个超实用的浏览器插件:一键提取网页表格数据

  •  1
     
  •   Fechin
    PRO
    133 天前 7210 次点击
    这是一个创建于 133 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近开发了一个浏览器插件 Table Detection & Extraction,专门解决网页表格数据提取的痛点,想和大家分享一下。

    平时工作中经常需要从各种网页上复制表格数据,比如 API 文档、数据统计页面等。传统的复制粘贴要么格式乱掉,要么需要手动整理,特别麻烦。

    插件功能

    • 智能识别:自动检测网页中的表格( 2 行 2 列以上的数据表)
    • 一键提取:鼠标悬停即可看到提取按钮,点击即可获取数据
    • 多格式导出:支持 30+ 种格式转换,包括 JSON 、Excel 、CSV 、Markdown 、SQL 、LaTeX 、HTML 、XML 、PDF 等
    • 跨浏览器:支持 Chrome 、Firefox 、Edge (插件审核中,通过后会在官网展示链接)

    实际使用场景

    就拿咱们 V2EX 来说,大家可以安装后试试这两个页面:

    API 文档页面help/api

    可以一键提取 API 接口表格,直接转换成 JSON 或 Markdown 格式用于文档

    一键提取网页表格数据

    IPv4 子网查询页面tools/ipv4

    子网信息表格可以直接导出为 Excel 或 CSV ,方便后续分析

    一键提取网页表格数据

    安装方式

    访问 https://tableconvert.com/ 页面,在 Data Source 区域可以看到 Chrome Extension 和 Firefox Add-ons 的下载按钮。

    Table Detection & Extraction Download

    Product Hunt 发布: 插件刚刚在 Product Hunt 上线: https://www.producthunt.com/products/table-detection-extraction 欢迎大家去支持一下,谢谢!

    为什么开发这个插件: 作为程序员,经常需要处理各种数据格式转换。市面上虽然有一些工具,但大多需要手动复制粘贴,效率不高。这个插件的核心理念就是"所见即所得",看到表格就能直接提取,大大提升工作效率。

    适用人群:

    • 数据分析师:快速提取网页数据进行分析
    • 开发者:提取 API 文档、配置表格等
    • 产品经理:收集竞品数据、功能对比表
    • 学生/研究者:整理网上的数据资料

    有兴趣的朋友可以试试,如果觉得好用的话,希望能给个好评支持一下!也欢迎大家提出改进建议。

    第 1 条附言    131 天前
    @isAK47 @willxiang @raycheung @asdblue @eryajf @zoharSoul 感谢各位的建议和反馈:

    已更新到版本:v1.1.7

    - 支持 Element UI 等框架的分离式表头/表体结构
    - 修复滚动表格时的图标位置
    - 改进清理和重新检测机制,确保扩展重新启用时能正确识别表格
    - 优化 AJAX 表格支持
    - 自动移除表格边缘的空行和空列
    - 调整 z-index 值到最高级别,确保转换图标始终显示在最前面
    - 添加用户评价状态跟踪,根据用户是否已评价显示不同的提示信息 [待验证]
    第 2 条附言    130 天前
    @bigbone123 以及发邮件反馈问题的同学,感谢各位的建议和反馈:

    已更新到版本:v1.1.8

    - 移除了对用户表格样式的不必要修改,避免影响页面布局
    - 新增对 iframe 和 frameset 结构的完整支持,解决了三帧结构网站中表格无法识别的问题
    第 3 条附言    117 天前
    Edge Extension 审核终于通过了,期间提交了好几个版本,每个版本都得等几天,吐槽一下微软的审核速度,需要的从这里下载: https://microsoftedge.microsoft.com/addons/detail/table-detection-extract/pckiffffenmnlnmhmbioajfdpoenahkj
    第 4 条附言    117 天前
    @yb2313 感谢建议和反馈:

    Chrome 、Firefox 版本已更新到版本:v1.1.9

    - 点击 icon 的关闭按钮后会隐藏当前页不再显示,直到刷新页面
    67 条回复    2025-08-02 09:43:41 +08:00
    isAK47
        1
    isAK47  
       133 天前   1
    管理后台的表格识别不到吧?
    Fechin
        2
    Fechin  
    OP
    PRO
       133 天前
    @isAK47 如果数据是 <table> 标签渲染的,理论上可以识别到
    isAK47
        3
    isAK47  
       133 天前   1
    @Fechin 刚才测试了自用的几个后端(阿里、百度),是标准的<table>,均未能识别到,前端没问题。
    Fechin
        4
    Fechin  
    OP
    PRO
       133 天前
    插件安装成功后刷新一下页面看看哈,还有确保全局开关打开:
    Fechin
        5
    Fechin  
    OP
    PRO
       133 天前
    @isAK47 哥,忘记 @ 你了。
    NoOneNoBody
        6
    NoOneNoBody  
       133 天前   1
    已经在用一个 table to csv 的 firefox 扩展,基本够用,暂时不试了
    你这个能转 markdown 等更多格式,看上去还不错
    Fechin
        7
    Fechin  
    OP
    PRO
       132 天前
    @NoOneNoBody 建议试一下,这个可以提取表格转换成 30 多种表格格式
    willxiang
        8
    willxiang  
       132 天前   1
    @isAK47 #3
    我试了下,也是没有识别出来
    Fechin
        9
    Fechin  
    OP
    PRO
       132 天前
    @willxiang 方便在 pastebin 贴一下 table 标签 的 innerHTML 吗
    Xi
        10
    Xi  
       132 天前
    还可以,但是不够用,可以做为一个备选
    isAK47
        11
    isAK47  
       132 天前   1
    @Fechin #4 不是这些基础原因导致的,你可以在一些主流平台(阿里、百度、腾讯)注册测试,像后台一些产品订单、账单详情、服务订单等都识别不到。昨天在公司后端尝试服务订单没有效果,今天换浏览器也不行。代码都看了,确实是 <table> 标签渲染的。
    Fechin
        12
    Fechin  
    OP
    PRO
       132 天前
    @Xi 针对这个工具的定位还有哪些地方不够用的,方便说说吗,不胜感激!
    Xi
        13
    Xi  
       132 天前   2
    @Fechin #12 我平时的需求可能和你的插件定有有点不一样,不是简单的复制网页上的表格,而是多页整套表格的表格的摘取,例如我现在用的最多的“Instant Data Scraper”这个插件。
    而你的插件只是看到页面上表格简单数据复制
    raycheung
        14
    raycheung  
       132 天前   1
    1. 插件安装
    2. 识别表格
    3. 点击 ICON 展开
    4. 焦点无法固定是怎么回事 @Fechin
    raycheung
        15
    raycheung  
       132 天前   1
    @raycheung #14 刷新了多次之后可以了,很神奇。
    Fechin
        16
    Fechin  
    OP
    PRO
       132 天前
    @raycheung 感谢反馈,我多测测看
    Fechin
        17
    Fechin  
    OP
    PRO
       132 天前
    @Xi 感谢分享
    @isAK47 我在阿里 DNS 解析列表也没识别出来,把 table 元素整段代码复制出来就可以识别到,看来不是识别的原因,可能被什么机制限制住了
    willxiang
        18
    willxiang  
       132 天前
    dsg001
        19
    dsg001  
       132 天前   1
    用 gemini 生成了一个简单的 tampermonkey 脚本,凑合够用了
    JaminT
        20
    JaminT  
       132 天前 via Android   1
    需要有互联网吗
    Fechin
        21
    Fechin  
    OP
    PRO
       132 天前
    @willxiang 这个表格被过滤了,目前是只检测超过两行两列以上数据的表格
    Fechin
        22
    Fechin  
    OP
    PRO
       132 天前
    @cuixiao603 需要能访问网页,但都是在浏览器内部运行,数据是安全的
    Fechin
        23
    Fechin  
    OP
    PRO
       132 天前
    @dsg001 适合自己的才是最好的
    asdblue
        24
    asdblue  
       132 天前   1
    试了一下,后台系统的表格没有识别出来,应该是用的 elemnetUI 实现的
    Fechin
        25
    Fechin  
    OP
    PRO
       132 天前
    @asdblue 谢谢分享,提供的信息很有帮助,我测试一下:

    - ant table ,如果有固定列或行识别不出来
    - element table ,都没识别出来

    正在修复中
    jzhm
        26
    jzhm  
       132 天前   1
    不错,很好用
    ha0719
        27
    ha0719  
       132 天前   1
    请问大佬,很多网页是用 div 写的类似表格的样式,这个插件可以识别出来不,我之前用过类似的,效果不好,后来就卸载了
    Fechin
        28
    Fechin  
    OP
    PRO
       132 天前
    @jzhm 感谢
    @ha0719 div 表格目前还没兼容,不过后面会考虑,关键是如何处理噪音,不然体验会更糟糕
    bigbone123
        29
    bigbone123  
       132 天前   1
    通过三帧结构切换 frame 地址中有表格没有出现,直接打开切换的 iframe 地址可以。
    eryajf
        30
    eryajf  
       132 天前   1
    原来这个工具站点是大佬开发的,表示已经用了两三年了,非常牛的网站,在此感谢一下
    eryajf
        31
    eryajf  
       132 天前   1
    @eryajf 提两个小建议:1.已经评论过,希望插件界面中的好评提示支持关闭。2 ,希望支持语言设置,并且页面中点击转换之后,自动跳转到该语言。
    jones2000
        32
    jones2000  
       132 天前   1
    上市公司 pdf 年报, 里面的财务报表可以识别吗?
    asdblue
        33
    asdblue  
       131 天前   1
    @Fechin 期待中,工作中还是有一些从后台系统复制内容出来的工作,有这个插件帮助会很大。
    Fechin
        34
    Fechin  
    OP
    PRO
       131 天前
    @bigbone123 请问三帧结构是这种形式吗?

    <frameset rows="80,*">
    <frame src="top.html"> <!-- 顶部导航 -->
    <frameset cols="200,*">
    <frame src="menu.html"> <!-- 左侧菜单 -->
    <frame src="main.html" name="mainFrame"> <!-- 主内容区 -->
    </frameset>
    </frameset>
    Fechin
        35
    Fechin  
    OP
    PRO
       131 天前
    @eryajf 感谢支持,很好的建议
    Fechin
        36
    Fechin  
    OP
    PRO
       131 天前
    @jones2000 目前还不支持 pdf 的识别
    @asdblue 已经找到问题了,正在准备提交商店审核
    i8k
        37
    i8k  
       131 天前   1
    去年我写了个类似的 [网页表格拷贝器 - V2EX]( https://v2ex.com/t/1097311)
    mekingname
        39
    mekingname  
       131 天前   1
    所有号称能提取表格的插件或者 AI Agent ,面对下面这个表格时全部失败。包括楼主的插件。

    https://uniquecapital.feishu.cn/wiki/MzqowR6C9iR1e9kIGxOcGejindg?table=tblum9k3wGjFwTzC&view=vewQ6vZMar
    sparkssssssss
        40
    sparkssssssss  
       131 天前   1
    一直用这个网站转换,感谢 op
    1gzNr
        41
    1gzNr  
       131 天前   1
    试了一下 能用
    请您喝一瓶红牛 谢谢
    YAOMFFL
        42
    YAOMFFL  
       131 天前 via Android   1
    雅虎财经可用,感谢
    Sosocould
        43
    Sosocould  
       131 天前   1
    老哥的网站我一直在用,表格转换很好用。

    但这个插件我用了一下,我工作的场景都使用不了,没遇到能识别出来的 T-T……我日常一般用这个: https://chromewebstore.google.com/detail/instant-data-scraper/ofaokhiedipichpaobibbnahnkdoiiah ,这个比较准
    Fechin
        44
    Fechin  
    OP
    PRO
       131 天前
    @i8k 不错,功能类似,按钮可以改成 hover 显示,体验会好点
    @pwelyn Table Detection & Extraction 只是数据来源的一种方式,tableconvert.com 还有更多处理数据的功能,尤其是 Magic ,作为程序员,我经常在用,推荐给你
    Fechin
        45
    Fechin  
    OP
    PRO
       131 天前
    @mekingname 这个表格是 Canvas 画布,要提取里面的数据确实难度很大,不过可以换个思路,复制后直接粘贴到

    https://tableconvert.com/excel-to-sql
    Fechin
        46
    Fechin  
    OP
    PRO
       131 天前
    @coolloves 谢谢支持
    @jiezaichan 多谢老哥,红牛已收到
    @YAOMFFL 谢谢支持
    Fechin
        47
    Fechin  
    OP
    PRO
       131 天前
    @Sosocould 谢谢,这个插件有点名气,也给 Table Detection & Extraction 提供了新的发展方向
    mekingname
        48
    mekingname  
       131 天前   1
    @Fechin 这个表格不支持复制
    sunulin
        49
    sunulin  
       131 天前   1
    常规的表格还好 刚去汽车之家试了下 配置表不行
    zoharSoul
        50
    zoharSoul  
       131 天前   1
    不行啊 弹不出来按钮
    1. 已确认刷新过页面
    2. 已确认是<table>
    zoharSoul
        51
    zoharSoul  
       131 天前   1
    @i8k #37
    你这个也提取不出来...
    Fechin
        52
    Fechin  
    OP
    PRO
       131 天前
    @sunulin 感谢反馈,方便贴一个链接吗
    @zoharSoul 感谢反馈,方便贴一个链接或者 pastebin 的源码吗
    Donahue
        53
    Donahue  
       131 天前   1
    还没用上,先感谢
    bigbone123
        54
    bigbone123  
       131 天前
    @Fechin 是的,三帧结构。
    Fechin
        55
    Fechin  
    OP
    PRO
       130 天前
    @bigbone123 问题已解决,请升级到 v1.1.8 试一下
    Fxshiny
        56
    Fxshiny  
       130 天前
    https://it365.gitlab.io/zh-cn/table-to-excel/

    有一个这个。感觉比识别表格更方便
    Fechin
        57
    Fechin  
    OP
    PRO
       130 天前
    @Fxshiny 说实话,这个一般般,就比如你把当前帖子的内容复制进去,检测出了 60 几个表格
    bigbone123
        58
    bigbone123  
       130 天前
    @Fechin 赞,大神
    aero99
        59
    aero99  
       126 天前
    可惜不支持通用 Userscripts 插件,Safari 没法使用
    haoxuexiaoyao
        60
    haoxuexiaoyao  
       117 天前
    开源么
    eryajf
        61
    eryajf  
       117 天前
    再反馈个问题:貌似点击关闭没有效果。部分表格很小,icon 会遮挡表格的内容,点击关闭也关闭不掉。
    Fechin
        62
    Fechin  
    OP
    PRO
       117 天前
    @eryajf 感谢反馈
    yb2313
        63
    yb2313  
       117 天前
    表格是 canv 的可以识别吗
    Fechin
        64
    Fechin  
    OP
    PRO
       117 天前
    @yb2313 识别不到哦
    31415926535x
        65
    31415926535x  
       117 天前
    原来这个网站也是大佬写的啊,巨好用,平常都是 F12 找到表格元素复制进去转 markdown 来着,前段时间还在想有个插件就好了
    greatghoul
        66
    greatghoul  
       116 天前
    太帅了,最近刚好需要这样一个工具,本来还打算自己写呢。
    yantao890
        67
    yantao890  
       115 天前
    页面有两个表格,第一个表格可以出现按钮,第二个则不行
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     960 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 19:17 PVG 03:17 LAX 11:17 JFK 14:17
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86