Obsidian 网页采集脚本

2021.08.10 16:32

Obsidian Minimal主题的作者 @kepano 分享了一个网页抓取 js 脚本,抓取网页内容的效果非常赞,使用方式也很简单,整理出来分享给大家。

  • 随便添加一个书签,例如:Clipper
  • 在标签上右键「编辑地址...」
  • 输入 js 脚本的代码内容保存
  • 使用时,打开网页、或者选中网页中的内容点击这个标签即可


JS 代码的下载可以访问作者的 GitHub obsidian-web-clipper.js
建议将代码复制到本地,粘贴到编辑器修改其中的 库名称、笔记存储位置以及标签名称。例如我的库名称是 Document、打算将剪藏的网页内容保存到 稍后阅读 文件夹,添加标签 #稍后阅读。

修改好的代码可以利用 Bookmarklet Maker 网站转换成书签形态。

  1. 访问 Bookmarklet Maker 网站,粘贴代码到 Code 区域
  2. 点击 Generate Bookmarklet 按钮
  3. 复制 Output 中的内容,编辑上面创建的 Clipper 的书签粘贴进去保存即可。

最后来看看抓取效果,有 YAML 的类别记录,网页中的代码抓取和还原不错,不过表格好像还不行。

Comments
Write a Comment
  • Hem reply

    hey,请教您,这种方法可以用于抓取微信公众号吗?我也是用Devon和Obsidian来做管理,此前抓取一直依赖Devonthink,但对微信公众号,尤其是其中的图片总是效果不好。不知道您是否有什么更好的方法?谢谢!

    • scomper reply

      @Hem 试过用 MarkDownload 扩展也不行,主要原因还是微信的封闭导致的。