フロンティア情報学特論

Yahoo!オークションにおけるデータマイニング by オークション事業部 翁松齢氏

  • データマイニング
    • 大量のデータから有用な情報を取り出す技術
    • 従来の統計解析との違い:量・種類・ネットワークで接続・
      • 統計解析、パターン認識、機械学習など様々な方法が使われる
  • Eコマース
    • コンビニチェーンや小売では仕入れ最適化などに
  • ネットオークション:システム利用料→出品者に課金
  • リアルオークション:手数料、入場料、掲載料
  • Yahooオークション
    • 1061万の出品、6440億円の取引(2005年、伊勢丹と同規模)、70.8億PV/月
    • 差し押さえ品の競売
  • トラブル、不正利用
    • 商品発送不履行、支払不履行、詐欺
    • 他人のID利用、いたずら
    • 商標権、著作権、肖像権に違反する出品、盗品
    • 価格吊り上げ
    • 誹謗中傷
  • 対策
    • ルール、ガイドライン、ブラックリスト
    • 葉書で確認しないと出品できない
    • 50万以下なら8割補償
    • 200人で247パトロール、3交代
    • 違反出品削除件数、5千件/日
  • 問題点
  1. 売った循環に罪となるもの(違法物品) -判定は容易、即刻削除
  2. 権利侵害(海賊版、盤) -判定はちょと難しい、申告ベースで削除
  3. 詐欺(契約不履行) -判定が困難 →詐欺検知システム<データマイニングの適用!>
  • 詐欺検知
    • 商品数に対して実数は極端に少ない
    • パトロールは経験が必要、でも難しい
    • 手口が変化する
    • 対象を絞り込む
    • モデリング→パトロール→モニタリング→モデリング→…
    • 事例データ:特徴、情報DB →詐欺スコア→ 対処ログ
  • 「いい人」度
    • 多面的な顧客評価 /今は取引者間の主観のみ
  • Future
  • Q&A
    • 7台くらいのサーバでやってるとか何とか
    • なんかいろいろ
    • エスクローの利用量はちょっとイマイチ、てかNGが出たらすい(藁
    • イタチごっこがダメになってきたら、うん?