Obsidian Minimal主题的作者 @kepano 分享了一个网页抓取 js 脚本,抓取网页内容的效果非常赞,使用方式也很简单,整理出来分享给大家。
- 随便添加一个书签,例如:Clipper
- 在标签上右键「编辑地址...」
- 输入 js 脚本的代码内容保存
- 使用时,打开网页、或者选中网页中的内容点击这个标签即可
JS 代码的下载可以访问作者的 GitHub obsidian-web-clipper.js 。
建议将代码复制到本地,粘贴到编辑器修改其中的 库名称、笔记存储位置以及标签名称。例如我的库名称是 Document、打算将剪藏的网页内容保存到 稍后阅读 文件夹,添加标签 #稍后阅读。
修改好的代码可以利用 Bookmarklet Maker 网站转换成书签形态。
- 访问 Bookmarklet Maker 网站,粘贴代码到 Code 区域
- 点击 Generate Bookmarklet 按钮
- 复制 Output 中的内容,编辑上面创建的 Clipper 的书签粘贴进去保存即可。
最后来看看抓取效果,有 YAML 的类别记录,网页中的代码抓取和还原不错,不过表格好像还不行。
hey,请教您,这种方法可以用于抓取微信公众号吗?我也是用Devon和Obsidian来做管理,此前抓取一直依赖Devonthink,但对微信公众号,尤其是其中的图片总是效果不好。不知道您是否有什么更好的方法?谢谢!
@Hem 试过用 MarkDownload 扩展也不行,主要原因还是微信的封闭导致的。