2009年筑波大学第三学群情報学類卒業. 2011年同大学院システム情報工学研究科博士前期課程修了,2014年同博士後期課程修了. 博士(工学). 同年より豊橋技術科学大学大学院工学研究科(情報・知能工学系)助教. ウェブ工学,自然言語処理,計算社会科学に関する研究に従事. 情報処理学会,言語処理学会,人工知能学会,日本データベース学会各会員.

English version: Faculty Members List of the University, researchmap

研究内容

ウェブ(インターネット)を便利に利用するための技術を研究しています。ウェブ工学(Web Engineering)、ウェブサイエンス(Web Science)、自然言語処理(Natural Language Processing)、計算社会科学(Computational Social Science)と呼ばれる研究領域に興味があり、主にソーシャルメディアの分析及び活用に関する研究に携わっています。ツイートの内容(テキスト)からその投稿位置を推定したり、どのような学術文献(論文)が流行しているかを分析したりしています。ウェブ検索エンジンにおける検索頻度をオープンデータで推定し、ウェブ上のトレンドのメカニズムを解析する研究にも取り組んでいます。

以前、ニュースやブログをはじめとするウェブページのコンテンツを自動抽出する研究を行っていました。ウェブページのコンテンツを抽出する事により、ウェブ検索エンジンの性能向上、ウェブページの研究利用促進などが期待されます。民間企業との共同研究を通じ、成果の一部は製品(ウェブサービス)に導入されています。

なお、共同研究を積極的に進めています。内容は多岐にわたりますが、ウェブクローリング、研究成果のプロトタイプシステムの構築で貢献できると思います。お気軽にご連絡下さい。現在、Twitterの位置情報付きツイート(日本国内:2011年5月20日~、全世界:2014年7月25日~、ほぼ全てをカバー)及び公式リツイート(2013年7月2日~、日本語及び英語、日本語のほぼ全てをカバー)並びにソーシャルグラフ月次観測(2014年1月~、日本語リツイートデータから取り出した約100万ユーザを定点観測)、Webニュースデータ(2004年4月~)、日英中韓対訳ニュースデータなどの収集を継続しています。

学生に対する研究指導

学生に対する研究指導は主に 応用数理ネットワーク研究室(梅村研) の中で行っています。研究室配属時に吉田がカバーする研究テーマ(ウェブおよびソーシャルメディアのマイニング)を希望する学生がいる場合、その学生の実質的な指導教員となります。

論文・講演など

学術論文(学術雑誌・査読有り)

  1. 日本における居住地推定に利用するためのフォロー関係の調査
  2. トレンドキーワードに関するウェブリソースの横断的分析
  3. ツイート投稿位置推定のための単語フィルタリング手法
  4. ラベル伝搬によるトレンドクエリのカテゴリ推定
  5. ブログページ集合からのポストおよびコメント自動分離抽出手法
  6. 教師情報を必要としないニュースページ群からのコンテンツ自動抽出

解説論文等(招待論文)

  1. ソーシャル言及数で論文に新たな評価軸
  2. オルトメトリクスは論文評価を変えるか -ソーシャルメディアで算出する新たな指標-
  3. 計量書誌学の新たな挑戦 -国産オルトメトリクス計測サービスの開発-
  4. ソーシャルメディアの政治的活用 ―活用事例と分析事例から―
    • 吉田光男, 松本明日香
    • 人工知能学会誌. vol.27, no.1, pp.43-50, 2012.
    • 2012年1月1日
    • メモ: 政治家および公共機関によるソーシャルメディアの活用事例、ソーシャルメディアの分析事例を解説しました。
    • (学会の著作権規定に基づき、PDFの配布は個別対応になっております。配布を希望される方は、メール等でご連絡下さい。)

国際会議・ワークショップ(査読有り)

  1. Uncovering Information Flow Among Users by Time-Series Retweet Data: who is a friend of whom on Twitter?
  2. Preliminary Investigation for Japanese Comic Analysis using Wikipedia (poster)
  3. Analysis of Home Location Estimation with Iteration on Twitter Following Relationship
  4. Improving Compression Based Dissimilarity Measure for Music Score Analysis
  5. Realizing Half-Diminished Reality from Video Stream of Manipulating Objects
  6. Using Conservative Estimation for Conditional Probability instead of Ignoring Infrequent Case
  7. Decision Tree Analysis of Tourists' Preferences Regarding Tourist Attractions Using Geotag Data from Social Media (note)
  8. Confidence Interval of Probability Estimator of Laplace Smoothing
  9. Wikipedia Page View Reflects Web Search Trend (poster)
  10. Patterns in Interactive Tagging Networks
  11. Why Do You Follow Him? Multilinear Analysis on Twitter (poster)
  12. Exploiting Twitter for Spiking Query Classification

国内会議・ワークショップ(査読有り)


Photo by Kazuyuki Shudo
  1. 物体を操作する映像におけるHalf-Diminished Realityの実現 (ショート発表)
  2. トレンドキーワードに関するウェブリソースの横断的分析
  3. Webニュースを用いた未来情報年表の自動構築 (ポスター発表)
  4. CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得
    • 吉田光男, 乾孝司, 山本幹雄
    • 楽天研究開発シンポジウム2009
    • 2009年11月14日(土) at 楽天タワー(東京都品川区)
    • 優秀論文賞, WebDB Forum 2010 ポスター発表推薦
    • メモ: 日本データベース学会論文誌で提案したコンテンツ自動抽出手法による結果を用いる事で、コンテンツ抽出ルールをCSSセレクタとして自動抽出する手法を提案しました。普及した記法で抽出ルールを表現する事により、様々なアプリケーションで再利用しやすいと考えます。

国内会議・ワークショップ(受賞関係のみ抜粋)

  1. NGA2015におけるユーザの情報収集と回遊行動の分析
  2. 重力モデルとTF-IDFを用いたジオタグ付きTwitterデータからの観光地抽出と魅力の評価
  3. Twitter位置情報・テキスト情報を用いた人の移動モデル構築と観光地推薦手法の提案
  4. 対象サービスに特化した日本語Webスペルチェッカーの開発 (データチャレンジ)
  5. 教師情報を必要としないWebページ群のコンテンツ自動抽出ツールの提案

その他の発表は researchmap の Misc をご覧ください

招待講演等

  1. NGA2015におけるユーザの情報収集と回遊行動の分析
  2. 重力モデルとTF-IDFを用いたジオタグ付きTwitterデータからの観光地抽出と魅力の評価
  3. ウェブマイニングのためのデータ収集と保存
  4. 不揃いなデータ達の分析を行う前のTips ― ウェブデータの収集と保存 ―
  5. トレンドと検索頻度とWikipediaページビューの三角関係
  6. 楽しい楽しい研究開発
  7. オルトメトリクスとは何か
    • 吉田光男
    • 平成26年度茨城県図書館協会大学図書館部会研修会
    • 2014年11月27日(木) at 筑波大学(茨城県つくば市)
  8. ソーシャルメディア上での学術文献の流通
  9. 学際的な研究とスタートアップ企業との産学連携
  10. 情報技術者・研究者の生きる道
    • 吉田光男
    • お茶の水女子大学附属高等学校 総合的な学習の時間「図書館情報メディア研究」
    • 2014年2月19日(水) at お茶の水女子大学附属高等学校(東京都文京区)
  11. 文献管理Tipsセミナー ―Mendeleyを使って―
    • 吉田光男
    • 筑波大学附属図書館 図書館講習会
    • 2013年7月16日(火) at 筑波大学(茨城県つくば市)
  12. 研究者から見た Mendeley
  13. 自然言語処理における企業と大学と学生の関係
  14. 開発運営を続ける楽しさ ~ニュース検索サイト CEEK.JP NEWS の開発を通じて~
  15. Web検索エンジンと共に
  16. 技術系サービスができるまで“日本発の検索エンジン”
    • 第2回WAZA CTOセミナー
    • 2006年7月29日(土) at 東京国際フォーラム(東京都千代田区)

学位論文

  1. ウェブ検索エンジンのためのテキスト種別特定に関する研究
  2. ブログページ集合からのポスト及びコメント自動分離抽出手法の研究
  3. 教師情報を必要としないWebページ群のコンテンツ自動抽出

ソフトウェア・デモシステム

  1. 未来情報年表
  2. ExtractUniqueBlock - コンテンツ抽出(本文抽出) Perl モジュール

その他

  1. 日本学術振興会特別研究員(DC1)申請書
    • 2011年
  2. 第17回WI2研究会 学生参加報告

受賞・表彰

  1. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 第9回Webインテリジェンスとインタラクション研究会, ステージ発表賞, 2016年12月.
  2. 吉田光男, 荒瀬由紀. 第9回 Webとデータベースに関するフォーラム, 論文賞 runners-up, 2016年9月.
  3. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 人工知能学会, 研究会優秀賞, 2016年6月.
  4. 風間一洋, 谷直樹, 榊剛史, 吉田光男. 第7回Webインテリジェンスとインタラクション研究会, 萌芽研究賞, 2015年11月.
  5. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 第7回Webインテリジェンスとインタラクション研究会, 学生奨励賞, 2015年11月.
  6. 吉田光男. 日本学生支援機構, 特に優れた業績による返還免除(半額), 2011年5月.
  7. 吉田光男. 筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻, 専攻長表彰, 2011年3月.
  8. 角田孝昭, 澤田健都, 吉田光男. 第3回楽天研究開発シンポジウム, 最優秀データチャレンジ賞, 2010年12月.
  9. 吉田光男, 乾孝司, 山本幹雄. 楽天研究開発シンポジウム2009, 優秀論文賞, 2009年11月.
  10. 吉田光男, 山本幹雄. 第1回データ工学と情報マネジメントに関するフォーラム, 優秀インタラクティブ賞, 2009年3月.

研究資金(外部資金)

競争的外部資金(科研費)

  1. 日本学術振興会, 科学研究費補助金(若手研究(B)・代表). ソーシャルメディアにおける学術文献言及量予測モデルの構築. 2016年4月-2018年3月.
  2. 日本学術振興会, 科学研究費補助金(基盤研究(B)・分担). 議論の背景・過程・結果を関連づける地方政治コーパスの構築とその学際的応用. 2016年4月-2020年3月.
  3. 日本学術振興会, 科学研究費補助金(基盤研究(B)・分担). 歴史認識・領土問題を巡る世論とメディア環境に関する学際的日韓比較研究. 2015年7月-2019年3月.
  4. 日本学術振興会, 科学研究費補助金(特別研究員奨励費). 時空間メタデータ検索をキーワード検索に統合したウェブ検索エンジンの実現. 2011年4月-2014年3月.

競争的外部資金(科研費以外)

  1. 国立情報学研究所, 平成28年度国立情報学研究所公募型共同研究. 学術情報サービスにおける閲覧行動とウェブにおける言及行動を横断した文献注目度の分析. 2016年4月-2017年3月.
  2. 楽天技術研究所, 研究奨励金(楽天研究開発シンポジウム2009). CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得. 2009年11月.

競争的資金(内部)

  1. 豊橋技術科学大学, 平成28年度高専連携教育プロジェクト. シラバスに対する高度検索閲覧システムの開発(長野工業高等専門学校 苅米志帆乃). 2016年7月-2016年3月.
  2. 豊橋技術科学大学, 平成27年度教育研究活性化経費. ソーシャルメディアを用いた学術文献評価指標の開発. 2015年7月-2016年3月.

民間企業等共同研究(共同研究費あり)

民間企業との共同研究も積極的に実施しており、特に新規事業のための研究開発に携わるケースが多いです(自身も起業経験があり、会社代表を兼業しています)。お気軽にお問い合わせください。

メディア掲載

  1. Staff Writer. Wikipedia page views show online search trends. 『MyBroadband.co.za』September 10, 2015, 2015.
  2. Martin Anderson. Wikipedia page views a potential key to open source web trends data. 『The Stack』September 9, 2015, 2015.
  3. スマートアプリ、豊橋技術科学大学と人工知能型アグリゲーション技術の共同研究を開始. 『Social Game Info』2015年07月06日, 2015.
  4. 籠谷千穂. スマートアプリ、豊橋技術科学大学と産学共同研究を開始. 『GameBusiness.jp』2015年07月01日, 2015.
  5. 求められるのは、 ユーザーの疑問や悩みを解決するコンテンツ. 『宣伝会議 2014年12月号』2014年11月01日, pp.38-39, 2014.
  6. 木村俊介. 〈結婚未満〉「ポスドク問題」で結婚には慎重に. 『朝日新聞』2012年04月28日, 週末be(青色), 4面, 2012.
  7. 漆間泰志. 検索システム、実力PR(JAPAN ITの異才たち). 『日経産業新聞』2010年05月18日, 6面, 2010.
  8. 福光恵. ネット次世代の原石たち. 『日経クリック』2007年02月08日(日経ベストPC+デジタル, vol.12, no.4), p.21, 2007.
  9. 田口元. 既存のサービスの不満な点を改良したい――CEEK.JP・吉田光男さん. 『ITmedia』2007年01月30日, 2007.

※他にもサービス(Ceek.jp, Ceek.jp News, Simple Fon Maps など)が雑誌にて多数紹介されています。

教育関係

教育歴

教育職員免許状

ティーチング・アシスタント(TA)

連絡先

E-Mail
yoshida [at] cs {dot} tut [dot] ac (dot) jp
Skype
ceekz_skype

所属・活動

豊橋技術科学大学

有限会社てっくてっく

学会

査読経験

座長経験

その他

ブログなど