僕の備忘録(PC、UN*X、ネットワーク関連が中心)なんです。
自分の書いたところは適当(な時とか)に書き換えますので御了承を。
$ w3m -V w3m version w3m/0.5.1, options lang=en,m17n,image,\ color,ansi-color,mouse,gpm,menu,cookie,ssl,ssl-verify,\ external-uri-loader,w3mmailer,nntp,ipv6,alarm,mark,migemo host:~/src/net/www/w3m/w3m-0.5.2$ ./w3m -V w3m version w3m/0.5.2, options lang=en,m17n,image,\ color,ansi-color,mouse,gpm,menu,cookie,ssl,ssl-verify,\ external-uri-loader,w3mmailer,nntp,ipv6,alarm,mark,migemo
ChangeLogを覗く。
活発さはどんな風なんだろうか。と考えて
$ grep ^2 ChangeLog |cut -c 1-7|uniq -c してみた。
結構波があるみたいだ。
その他、適当にフィルタを通してあーだこーだ。
kernel-2.6.21.1のnoteに色々。
fuse-2.6.5とntfs-3g-1.516を入れた。動作確認。
それからmadwifi-0.9.3.1もmake install。これもOK。
インデックスに「本日のリンク元」が混ざらないように、
sqeezeされたHTMLから、そこだけ抜くスクリプトを書いた。
本当はもっと洒落たスクリプト言語で優雅に...なんて
妄想したが、
実装は全然進歩がない。
HTML化されたtdiaryは10月7日なら、ファイル名は1007とかになっている。
このうち、リンクより下の15行はどこも同じらしい。で、
リンク元位置をgrepで探し、そこより2行上までhead -nする。
それに下の15行をくっつける。
#!/bin/sh ROOTPATH="$CACHE/$HTML/" KEYWORD="<div class=\"caption\">本日のリンク元</div>" TAIL=tail.txt LINE=`grep -n "$KEYWORD" $1 | cut -f 1 -d":"` #echo $LINE if [ -z $LINE ]; then exit 0 fi BOT=`expr $LINE - 2` head -n${BOT} $1 > ${1}.new cat ${ROOTPATH}${TAIL} >> ${1}.new mv ${1}.new $1 chown $WEBUSER:$WEBGROUP $1
処理時間は数分で終了。で、namazuのindexもどけておく(消す勇気がない)。
あ、tdiaryを書くたびにsqeezeされるんだったっけ。cronか何かでスクリプト
を回さないと...
と考えて、もう一つ。cronにかけるのを深夜にしようとすれば、日付を一日ずらなさいと。
#!/bin/sh NAME=`date --date '1 days ago' "+%m%d"` YEAR=`date "+%Y"` FILE="/$HTML/$YEAR/$NAME" $LAST_SCRIPT $FILE
リンクはご自由にどうぞ。でもURLや内容が変った場合はあしからず。