付费墙的短与长(二):怎样有效保存已订阅内容

2023-09-15 16:55:00
jkadmin
原创
1140

中,咱们会商了当今付费墙的主流类型,并先容了付费墙的常睹告竣机制。但比起这些外面题目,普通读者更属意的一个实践题目或许是:怎样有用地留存依然置备的付费内容?这便是本次要会商的话题。

对平居用户来说,最常接触到、门槛最低的付费内容留存技巧,可能便是行使各样「稍后读」办事了。但正如你或许依然通过施行觉察的,稍后读办事并不总能很好应对这种场景。

以是,这里咱们要办理的题目便是 ( 1 ) 为什么稍后读抓不到付费墙后的作品,以及更主要的, ( 2 ) 奈何才力抓到。

很彰着,倘若你要掀开的作品有付费墙,稍后读办事很或许会卡正在第 2 步:它的办事器没有你的付费账户登录新闻,也就看不到无缺的付费内容。

正在一台有公网 IP(或者修设了内网穿透)的电脑上恣意新修一个目次,好比 test;然后正在内中放一个 paywall.html 的网页,内容可能看心理恣意打两行:

(依赖 npm;我清楚或许有一千种技巧来起一个大略的 HTTP 办事器,用这个技巧只是由于 npx 不消配境遇、可能即用即扔,以及http-server的默认日记样式对照知晓。)

如此,咱们就有了一个位于 的「付费墙」内容,它受到HTTP 基础认证的爱护,只要输入用户名和暗号才力看到「作品」。

可能看到,Instapaper、Matter、Pocket 和 Readwise Reader 这些主流东西都不行抓取到「正文」内容。这是意思之中的,由于它们的办事器无法绕过咱们修设的暗号。

现正在咱们换一种技巧。删掉刚刚留存腐臭的作品,直接正在浏览器里访候这篇「付费作品」,输入用户名 user 和暗号 pass 解锁,然后用这些稍后读办事各自的浏览器插件来留存。

可能看到,Instapaper、Readwise Reader 和 Matter 这回都胜利留存了暗号爱护的内容。(从 Pocket 被 Mozilla 收购后好逸恶劳的记实看,它成为独一的吊车尾也是可能剖释的。)

这是若何做到的?尖锐的读者从 http-server 的日记就可能看出面伙:正在第二次留存的时分,那些稍后读办事的办事器底子没有向咱们的「付费作品」发出仰求。

本来,当行使许众稍后读办事的浏览器插件留存网页时,网页内容底子不是它们「抓」下来的,而是咱们主动「送」上门的:伺探汇集行动就会觉察,点击 Instapaper、Readwise Reader 和 Matter 的浏览器插件按钮时,都市触发一个指向它们各自 API 端点的 POST 仰求,其内容恰是加载完毕的网页全文 HTML。

以是,咱们就清楚了用稍后读留存付费内容的「精确神情」:只须先用浏览器加载出无缺的付费内容,然后行使稍后读办事的插件留存就行了。相反,正在链接上点击右键留存,或者正在稍后读办事中行使增添链接效力留存,都不行让稍后读办事「看到」无缺的网页,也就不行存下无缺的付费内容。

正在剖释道理的根蒂上,咱们乃至可能愚弄这个机制,让稍后读不光能留存下付费内容,况且根据咱们思要的格局留存下内容。比如:

对待英文付费内容,可能先用「重溺式翻译」如此的插件将内容页面翻译一遍,然后再行使插件留存,就能存下始末翻译的内容;

对待稍后读办事不行很好解决的繁复页面,可能先用「检讨元素」(DevTools)或者广告删除页面上的内容无合元素,然后再用插件留存,就能避免这些元素混入存下的版本。

相似的机制和用法也实用于 iOS。你可能没蓄意识到,当你正在 Safari 中行使「分享」菜单毗邻第三方操纵时,它们得到的并不是一个纯真的网址,而是一个称为「Safari 页面」的复合对象,个中蕴涵了 ( 1 ) 网址、 ( 2 ) 网页 HTML 对应的富文本,以及 ( 3 ) 从网页中提取的作品(即「阅读器」效力抓取到的结果);被毗邻的操纵可能按需从中提取。

(你可能通过将页面分享给只要一个「内容项目图」(Content Graph)设施的赶紧指令,很知晓地伺探到这一点。)

网罗前面提到的主流稍后读东西正在内,许众第三方操纵都可能通过读取 Safari 分享页面中的 HTML,获取 Safari 加载完毕的网页内容,从而无需再自行抓取、也不受付费墙局部。当然,告竣这个效率的条件是从已掀开的 Safari 页面分享(也网罗从第三方操纵中点击链接掀开的 Safari View Controller);长按链接分享、或者用第三方浏览器分享都是不可的。

至于 Android 用户——很缺憾,纵然 Android 正在外面上也增援通过分享菜单传输富文本内容,但据我测试,目前还没有哪个浏览器增援「分享」出目下浏览的页面内容,网罗「亲生」的 Chrome。

文章分类
联系我们
联系人: 王经理
Email: 1735252255@qq.com
QQ: 1735252255
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-4号