タグ『 jawiki/latest 』

≒ jawiki/latest 20151020/ のページ数の件>1989570

10月は2回dump取りあったんだなー。ボランティアの皆さんには足を向けて寝られない。僕にできるのは時々の寄付だけだ。あー。

未だにAndroid入門。遅々として進まず、アプリ公開なんてまだ先の話。
ここ2~3日はMediaPlayerとAudioTrackのどっちを使うかで試行錯誤。
結局今はAudioTrackで組んでいくことになったんだけど、

  • MediaPlayer
    • メリット
      1. UIと親和性高い。
      2. 組むのが簡単。ネット上の情報も豊富
      3. メディアタイプを選ばない。mp3はもちろん、FLACもそのまま再生できる
    • デメリット
      1. 音データを細かく引っ張り出して処理するのが難しい。定番としては、Visualizerクラスを使う(それ以外の方法見つけられず)のだけど、各種eventListenerで拾って処理していくので、自前でThreadとか作らなくて良い分簡単なんだけど、当然データ取得タイミング(=データサイズ)を自由に設定できない。
      2. Visualizerで取得できるデータがいまいち。周波数もずれてるような。色々やっても400Hzが344Hzとか出る。そのズレの修正アルゴが分からない。それに最大値と最小値にも制限がある。簡単なイコライザー的な処理や、ヴィジュアライズ処理にならそれほどシビアに音の周波数拾わなくって良いんだろうけど。その結果一切GCが走らないのは大きなメリットだけどw
  • AudioTrack
    • メリット
      1. byte配列でデータをやり取りするので途中で抜きやすい。というかデータ処理部分は普通にFileInputStreamとか使うので自由度高い&Java使いには分かりやすい。
      2. 一応各種eventListenerも揃ってる。情報見つけるの難しいけど。
    • デメリット
      1. Waveファイルしか再生できない。それ以外のタイプは事前に変換処理必要。またメモリが圧迫される…
      2. AudioTrackの情報が少ない。2011年の情報とか未だに重宝するのはAndroid開発では珍しいと思う。
      3. GC走りまくり。(それはお前のプログラミング能力ががが)

ということで、現状の知識を整理。後で読み返して間違ってることがあったら実装内容変えよう。
しかし、今までもwebサイト構築はTomcat+DWRで基本やってきたんで、Java使ってきたと思ってたけど、Androidみたいに全部Javaで書いてると改めて発見することが多い。継承とかオブジェクト(クラス)志向とか知識としては持ってたけど、きっちり実践してたわけではない概念?をAndroidの場合ある意味強制されるからより理解が深まる感じ。以上。

≒ jawiki/latest 20151002/ のページ数の件>1983410

今回も3週間近く遅れちゃった。一旦落としたファイルが壊れてて再度ダウンロードしたりして無駄に時間ががが。
もう次の20151020のダンプが始まったみたい。最近早いなー。でもダンプのたびに順調?に1万ページ位ずつページ増えて行ってる。
wikipediaって地味だけど着実に成長してるメディアなんだと感じる。

で、私のほうの成長は遅々として進まずw 相変わらずAndroid開発入門レベル。とりあえずActivityのライフサイクルの感触がようやく掴めかけた感じ。
何で画面回転のたびにいちいち色んなもの初期化しちゃうのかとも思うけど、スマートフォンという非力な端末でマルチタスク(緊急通報とか重要インフラ含む)を動かそうとするとこんな感じになっちゃうのも仕方ないのかなと。唐突に上から目線w

デスクトップPC導入して、トラックポイント無いとPC使えないのでレノボのブルートゥースのやつとか一世代前のUSBのやつとか引っ張り出してきて使ってたんだけど、えらくTypoしまくる。
前まで使ってたThinkPadW500のキーボードがArabicで、エンターキーがvertical(縦に長いやつ)なのになれてたから、普通のUSキーボードだとHorizontalなエンターキーだからその上の「\」を間違えて打っちゃう。
ebayで色々探して「IBM UltraNav USB Keyboard With Pointing Device Cable USB 94Y6206」つーのを購入。UKキーボードらしい。送料含めて1万弱。きっちり新品で特有の良い匂い。
ドライバーもレノボの最新のやつ入れたら普通に使えてる。不満はwindowsキーがないことくらい。プラセボ臭いけど、IBMってだけで質感高い感じしちゃう。
気に入ったからこれのArabic探すかな。

≒ jawiki/latest 20150901/ のページ数の件>1972775

今回もえらく遅くなった。enwikiのデータでサイト作る件は今はデータ収集の段階で、うちのPCががんばってるばかりでやることがあまりない。まぁ、細かなトラブルは色々あってスクレイピングのアルゴは色々いじってはいますけどね。

んで今夢中なのがandroidアプリ作成(開発なんてたいそうなものではない)。ユーティティアプリ作ろうと思ってはじめたんだけどいつの間にかopenGLES触ってるw いつものこと。

いまさらながら数学的素養がまったくないことで四苦八苦。でもwebGLでは結局three.jsに逃げたのが今回は少しづつでも行列演算の理解が進んでいる。上手く行ったらもう一度webGLを直に叩いてなんか作ってみよう。やっぱりライブラリかませると隔靴掻痒なとこあったし。遅いし。

enwiki。着々とデータ集まってきてるんだけど、例えば「eve」って名前の人、歌手やポ○ノの人にもいるんだけど、当然人類最初の女性である人もwikiには記述があるわけで。

そんで「eve」って名前だけでスクレイピングして項目紐付けしてると、人類最初の女性のスリーサイズがうちのサイトでは判明することになってしまうw

あまりにも不敬でなんかありそうで怖い。そういう項目を最終的に排除するアルゴリズムを今考えてます。