Email
如何導出 Google 快訊引文?
我的電子郵件中有幾個月的 Google 快訊,我想在網路上的某個地方分享它們(例如在 MediaWiki wiki 上)。有沒有簡單的方法來導出它們?
警報包含此類 HTML(來自 Thunderbird):
<div style="color:#fff;font-size:9px;letter-spacing:0.8px"> <div style="padding:3px 0px 4px 4px;background:rgb(255,255,255);background-color:rgba(0,0,0,0.5);width:96px">La Provincia di Biella</div> </div> <!--[if gte mso 9]></div><![endif]--> </td> </tr> </table> </a> <div> <span style="padding:0px 6px 0px 0px"> <a href="https://www.google.com/url?rct=j&sa=t&url=http://www.laprovinciadibiella.it/web/castelletto-cervo-nei-siti-cluniacensi-9458&ct=ga&cd=CAEYACoTMzc2NjcxMzA4NDYzNjc4NjUwMjIZZThjOGE1NjBlZjA5ZDRkMDppdDppdDpJVA&usg=AFQjCNEW4QKACEvE_AbGrMGOBJ2y4dFSIw" style="color:#427fed;display:inline;text-decoration:none;font-size:16px;line-height:20px">Castelletto Cervo nei siti cluniacensi</a> </span> <div> <div style="padding:2px 0px 8px 0px"> <div style="color:#737373;font-size:12px"> <a style="text-decoration:none;color:#737373">La Provincia di Biella</a> </div>
這對我有用:
- 從您的電子郵件中將警報下載到 Thunderbird 目錄;
- 安裝 ImportExportTools 外掛並將整個目錄導出為 HTML;
- 轉到導出目錄並執行:
find * -print0 | xargs -0 -I § bash -c 'NAME="§"; DATE="{{#time:j F Y| ${NAME:0:8} }}"; grep --text -Eo "ru=([^&]+)&" "§" | sed "s,ru=,;$DATE:,g" | sed "s,&,,g" ; ' | sort -ru
我將
;$DATE:
其用作每個 URL 的前綴,因為這是有意義的 wikitext 和解析器功能,可以輕鬆翻譯導出文件使用的“AAAAMMDD”格式。你可以用任何東西代替。更智能的版本可能會將 URL 發送到 Zotero 或 Citoid 以獲得正確的引用,或者可能解析原始 HTML 以提取更多資訊。對於 2014-01-18 之前的警報,HTML 格式似乎有所不同。
使用 GNU findutils 4.5.12、bash 4.3.42 測試。
TODO:下載“查看更多文章”連結並解析它們。在忙碌的日子裡,電子郵件僅包含隨機選擇的“熱門”新聞。