前言
2025-03-31 到 2025-04-06 的生活&记录&思考&null
封面图拍摄于清明节在中山博物馆的照片
为什么不展示博物馆里面的照片呢?
因为P人本人没看时间 去的时候刚好关门了
如何阻止AI爬虫
阮一峰老师的周刊343期:科技爱好者周刊(第 343 期):如何阻止 AI 爬虫
提到了SourceHut 的站长发表的文章 ,提到了现在AI大模型需要很多的数据,导致公司的爬虫非常嚣张,数量很多并且访问频率很高,导致服务器压力很大
他推荐了一个除了Cloudflare以外的另一个思路:让爬虫爬取数据的成本提高
使用Anubis这个项目: GitHub - TecharoHQ/anubis: Weighs the soul of incoming HTTP …
这个工具很有意思,让用户打开网页的时候加载js文件,这个js文件是工作量证明算法 会进行大量计算
可以很有效地消耗爬虫的 CPU
事实证明,它很有效。一个站长说,两个半小时内,他的网站总共收到了81000个请求,其中只有3%通过了 Anubis 的工作量证明,这意味着97%的流量可能都是机器人!
这太疯狂了,可见现在的 AI 爬虫有多猖獗。
如果你的网站也遇到了同样问题,又没法使用 Cloudflare,那可以试试 Anubis 的工作量证明。
哈哈哈之后有空试一下,不过会让普通用户的访问体验变差
谷歌将不开放安卓的开发
https://www.androidauthority.com/google-android-development-aosp-3538503/
CSDN居然把AI的回答丢上去收费
https://linux.do/t/topic/524823
CSDN充斥着大量的抄袭,搬运 平台不管不顾 风气比较差
特别是这两年因为生成式AI的流行 直接把生成的超低质量回答输出到平台还收费 这。。。?
放生小鸡
有一台西雅图小鸡到期了 准备放生了(不续约)
用了两年的小鸡,非常低的价格也算是物超所值了
倒是在最后这段时间用hysteria2协议让使用体验好了很多
hysteria2不愧是线路拯救者
什么是小鸡?: 小鸡就是VPS,参考: 小鸡

有趣的项目
https://github.com/QIN2DIM/hcaptcha-challenger
hCaptcha Challenger (v0.13.0+) 借助大语言模型的 Spatial Chain-of-Thought (SCOT) 能力构建了一套端到端的 Agentic Workflow,使得 Agent 可遵循指令完成空间视觉通用任务,而无需额外训练或微调 CNN 专家模型。
在 hCaptcha Challenger 中,Agent 通过 Playwright 控制浏览器页面。在您的任务流程中,Agent 通过传入的 Page 对象初始化,并借用该对象接管当前页面的交互。您可以通过 Agent 实现 click_checkbox(点击验证框)和 wait_for_challenge(等待人机挑战)两个独立操作。
hCaptcha 是最早将图片扩散与合成技术应用于 CAPTCHA 领域的先驱之一。借助自动化工程领域的快速发展,hCaptcha 能够实现极为频繁的挑战类型更替。这导致过去两年中,社区在应对频繁更新的人机挑战时面临了越来越大的困难。传统的卷积神经网络(CNN)在目标检测任务中,对于小规模数据集难以实现良好的泛化效果,完整的模型微调过程需要投入大量的时间与精力,通常需要长达半周才能训练出适用于生产环境的 CNN 模型。然而,当模型训练完成之际,hCaptcha 可能已经更新了新的挑战类型,导致刚训练完成的模型迅速过时或失效。
因此,社区迫切需要一种强大的通用视觉解决方案,以有效应对空间视觉类的通用挑战。不论 hCaptcha 如何频繁更新验证类型,该方案均可快速适应环境变化,并能在无人引导的情况下自主控制浏览器完成各种人机验证任务。
中山
清明节去中山逛逛
一座小城
乳鸽还不错
第二天去唯一感兴趣的中山博物馆,但是P人本人没看时间,去的时候刚好关门了


