カテゴリー『 未分類 』

≒ jawiki/latest 20151202/ のページ数の件>2002803

200万レコード超えた。おめでとうございますw

 

さて、前回初Androidアプリって書いたけど、URL張り忘れた。

「Squares.」
https://play.google.com/store/apps/details?id=jp.beingtested.squares

試してたらたった一日で色々不具合爆発。公開すると一歩引いてみるから粗もよく分かる。

基本的なとこで恥ずかしいけど、アイコン設置忘れなんてやってるし、一番やばかったのが上のURL見るとパッケージ名=ドメイン名がプレイストアのidに自動的に入るみたいなんだけど、別に保有してるライトアダルトのサイトのドメイン入れちゃってた。

デベロッパーサイトとしてはこのブログのあるドメインを表示してるのに、idでア○ルトサイト乗っけてたら胡散臭すぎるでしょw

で、パッケージ名完全に変えてアップロードしてみたら受け付けてもらえず(当たり前か)。結局「人生初のAndroidアプリ」は一日で公開停止…

新規に同じ内容のアプリを公開しました。なんと(同じく当たり前か)一人のデベがまったく同じ名前のアプリを複数公開するのはNGらしい。で、↑のアプリ名をよくみるとカンマが付いてますwww

≒ jawiki/latest 20151102/ のページ数の件>1993124

今日は1時間ほどPC作業。

ようやくAndroidアプリの骨格が出来てきて、懸案のカメラ(画像)処理の部分に昨日から取り掛かる。

特徴色(DominantColor)抽出に再挑戦。前回はwebアプリで色々やってみたんだけど、結局途中であきらめて「なんちゃってMedian cut」でお茶を濁して終わり。

どこがなんちゃってかというと、赤系のワンポイントの色が上手いこと拾えなくて、試行錯誤の末R値だけ優遇するという悲惨な結果にw

今回はoctreeアルゴでやってみようとして色々ためしてる。何故か前回はたどり着けなかった「Jimi」ってライブラリを使ってJava環境ではある程度実現できたんだけど、

そのままではAndroid環境では使えない。Awt系API使いまくってるからね。

で、「無理やりAwt」「ImageMajikに路線変更」「そのためだけにunity」などなど色々ググりまくって調べて方策を練ったんだけど、最終的にはJimiのソースコードまじめに読んで自分なりの実装を組んでみることにした。コピペプログラマーらしからぬ決断だけど、さすがsun様、コードがきれいで追いやすい。プログラミングの勉強になりそうだし、しばらく頑張ってみます。

今日、香港からトルコ語配列のThinkpad200向けキーボード届いた。たった3000円くらいで2週間で新品が届くんだからやっぱりThinkpadって良いなと思った。

換装はアメリカからヒートシンク(ファン付き)が届いてから。こちらは送料込みで1500円くらいw

≒ jawiki/latest 20150703/ のページ数の件>1703701

相変わらず更新滞ってますが、一人で趣味プログラミングしてるとgitとかも結局使ってないし(何回か導入チャレンジはしてる)、他人と何かを共有する必要性が全然無いのよね。

昔から「小説は読むもので書くものではない」が俺々定義なんだけど、webも一緒なかんじ。といってもアフィサイトは公開してますが。全然売り上げないけど。

ということでこのブログにもgoogleアドセンス付けて早2ヶ月、当然売り上げゼロですが、少しは更新がんばってみようということで、今後はwikipediaデータを利用したサイト群のためにjawiki/latestが更新される都度行うデータ更新作業の結果のページ数を記録しておこうというコーナーです。

今回(20150703)の更新では、jawiki-latest-pages-articles.xml.bz2(全ページの記事本文を含むXML)が4分割版のみになって(今確認したら一括版はwaitingになってる)、mwdumper.jarで4回処理する必要がある。初めてだったので何か引数で指定しないと上書きされるんじゃ無いかと思ったけど、何もしないでも無事追記されてる模様。

で、結果ページ数。 mysql> SELECT COUNT(*) FROM text; → 1703701

前回の結果は残してないんだけど、去年の10月くらいの更新の時は1853286ページ。だいたい毎月これより微増することはあっても減ることは無かったのに。最終的に加工してサイトで使うデータも15%くらいへっちゃてるし。

というわけで、今回は更新見送りで6月のデータに戻す。waitingの一括版が出るか、次の更新がくるまでこのまま。何か「お前間違ってるよ」ってのがあったらご指摘ください。