周記#12- 微小假期

作者: Harry / 2025-04-07 / 分類: weekly

周記

翻譯: ZH-CN, EN

前言

去晚了 2025-03-312025-04-06 的生活&記錄&思考&null

封面圖拍攝於清明節在中山博物館的照片 為什麼不展示博物館裡面的照片呢? 因為P人本人沒看時間 去的時候剛好關門了

如何阻止AI爬蟲

阮一峰老師的周刊343期:科技愛好者周刊(第 343 期):如何阻止 AI 爬蟲

提到了SourceHut 的站長發表的文章 ,提到了現在AI大模型需要很多的數據,導致公司的爬蟲非常囂張,數量很多並且訪問頻率很高,導致服務器壓力很大

他推薦了一個除了Cloudflare以外的另一個思路:讓爬蟲爬取數據的成本提高

使用Anubis這個項目: GitHub - TecharoHQ/anubis: Weighs the soul of incoming HTTP …

這個工具很有意思,讓用戶打開網頁的時候加載js文件,這個js文件是工作量證明算法 會進行大量計算

可以很有效地消耗爬蟲的 CPU

事實證明,它很有效。一個站長說,兩個半小時內,他的網站總共收到了81000個請求,其中只有3%通過了 Anubis 的工作量證明,這意味著97%的流量可能都是機器人! 這太瘋狂了,可見現在的 AI 爬蟲有多猖獗。 如果你的網站也遇到了同樣問題,又沒法使用 Cloudflare,那可以試試 Anubis 的工作量證明。

哈哈哈之後有空試一下,不過會讓普通用戶的訪問體驗變差

谷歌將不開放安卓的開發

https://www.androidauthority.com/google-android-development-aosp-3538503/

CSDN居然把AI的回答丟上去收費

https://linux.do/t/topic/524823

CSDN充斥著大量的抄襲,搬運 平台不管不顧 風氣比較差

特別是這兩年因為生成式AI的流行 直接把生成的超低質量回答輸出到平台還收費 這。。。?

放生小雞

有一台西雅圖小雞到期了 準備放生了(不續約)

用了兩年的小雞,非常低的價格也算是物超所值了

倒是在最後這段時間用hysteria2協議讓使用體驗好了很多

hysteria2不愧是線路拯救者

什麼是小雞?: 小雞就是VPS,參考: 小雞

有趣的項目

https://github.com/QIN2DIM/hcaptcha-challenger

hCaptcha Challenger (v0.13.0+) 借助大語言模型的 Spatial Chain-of-Thought (SCOT) 能力構建了一套端到端的 Agentic Workflow,使得 Agent 可遵循指令完成空間視覺通用任務,而無需額外訓練或微調 CNN 專家模型。 在 hCaptcha Challenger 中,Agent 通過 Playwright 控制瀏覽器頁面。在您的任務流程中,Agent 通過傳入的 Page 對象初始化,並借用該對象接管當前頁面的交互。您可以通過 Agent 實現 click_checkbox(點擊驗證框)和 wait_for_challenge(等待人機挑戰)兩個獨立操作。 hCaptcha 是最早將圖片擴散與合成技術應用於 CAPTCHA 領域的先驅之一。借助自動化工程領域的快速發展,hCaptcha 能夠實現極為頻繁的挑戰類型更替。這導致過去兩年中,社區在應對頻繁更新的人機挑戰時面臨了越來越大的困難。傳統的卷積神經網絡(CNN)在目標檢測任務中,對於小規模數據集難以實現良好的泛化效果,完整的模型微調過程需要投入大量的時間與精力,通常需要長達半周才能訓練出適用於生產環境的 CNN 模型。然而,當模型訓練完成之際,hCaptcha 可能已經更新了新的挑戰類型,導致剛訓練完成的模型迅速過時或失效。 因此,社區迫切需要一種強大的通用視覺解決方案,以有效應對空間視覺類的通用挑戰。不論 hCaptcha 如何頻繁更新驗證類型,該方案均可快速適應環境變化,並能在無人引導的情況下自主控制瀏覽器完成各種人機驗證任務。

中山

清明節去中山逛逛

一座小城

乳鴿還不錯

第二天去唯一感興趣的中山博物館,但是P人本人沒看時間,去的時候剛好關門了

中山博物館旁邊的咖啡店

去晚了

輸入

🎧播客

📚文章

📚書籍

🎥劇集

🎸音樂

Harry

Harry

ENFP | 全棧工程師 | 喜歡探索和使用新技術