2009年筑波大学第三学群情報学類卒業. 2011年同大学院システム情報工学研究科コンピュータサイエンス専攻博士前期課程修了,2014年同博士後期課程修了. 博士(工学). 同年より豊橋技術科学大学大学院工学研究科(情報・知能工学系)助教. ウェブ工学,計算社会科学,自然言語処理に関する研究に従事. 情報処理学会,言語処理学会,人工知能学会,日本データベース学会の各会員.

English version: Faculty Members List of the University, researchmap

研究内容

ウェブ(インターネット)を便利に利用するための技術を研究しています。ウェブ工学(Web Engineering),ウェブサイエンス(Web Science),計算社会科学(Computational Social Science),自然言語処理(Natural Language Processing)と呼ばれる研究領域に興味があり,主にソーシャルメディアの分析及び活用に関する研究に携わっています。ツイートの内容(テキスト)からその投稿位置を推定したり,どのような学術文献(論文)が流行しているかを分析したりしています。ウェブ検索エンジンにおける検索頻度をオープンデータで推定し,ウェブ上のトレンドのメカニズムを解析する研究にも取り組んでいます。

以前はニュースやブログをはじめとするウェブページのコンテンツを自動抽出する研究を行っていました。ウェブページのコンテンツを抽出する事により,ウェブ検索エンジンの性能向上,ウェブページの研究利用促進などが期待されます。民間企業との共同研究を通じ,成果の一部は製品(ウェブサービス)に導入されています。

研究と開発は両輪であると考えています。ウェブサービスの開発もしており、現存する日本語のロボット型ニュース検索エンジンとしては最古となる Ceek.jp News や、日本語の学術文献の社会的インパクトを測定する Ceek.jp Altmetrics などの運用を続けています。

共同研究を積極的に進めています。内容は多岐にわたりますが,ウェブクローリング,研究成果のプロトタイプシステムの構築で貢献できると思います。お気軽にご連絡下さい。現在,Twitterの位置情報付きツイート(日本国内:2011年5月20日~,全世界:2014年7月25日~,ほぼ全てをカバー)及び公式リツイート(2013年7月2日~,日本語及び英語,日本語のほぼ全てをカバー)並びにソーシャルグラフ月次観測(2014年1月~,日本語リツイートデータから取り出した約100万ユーザを定点観測),Webニュースデータ(2004年4月~),日英中韓対訳ニュースデータなどの収集を継続しています。

民間企業との共同研究も積極的に実施しており,特に新規事業のための研究開発に携わるケースが多いです(自身も起業経験があり,会社代表を兼業しています)。

研究内容に関しては,大学公式サイトの教員紹介も合わせてご覧ください。

学生に対する研究指導

学生に対する研究指導は 応用数理ネットワーク研究室(梅村研) の中で行っています。研究室配属時に吉田がカバーする研究テーマ(ウェブおよびソーシャルメディアのマイニング)を希望する学生がいる場合,その学生の実質的な指導教員になる場合があります。

論文・講演など

学術論文(学術雑誌・査読有り)

  1. Profiling the Spatial Structure of London: From Individual Tweets to Aggregated Functional Zones
  2. Extraction of Tourist Destinations and Comparative Analysis of Preferences Between Foreign Tourists and Domestic Tourists on the Basis of Geotagged Social Media Data
  3. 講師のシルエットを透過表示した板書映像の生成とライブビューシステム
  4. ジオタグ付きツイートを用いた交通路の抽出法
  5. 条件付き確率の保守的な推定
  6. 日本の学協会誌掲載論文のオルトメトリクス付与状況
  7. 日本における居住地推定に利用するためのフォロー関係の調査
  8. トレンドキーワードに関するウェブリソースの横断的分析
  9. ツイート投稿位置推定のための単語フィルタリング手法
  10. ラベル伝搬によるトレンドクエリのカテゴリ推定
  11. ブログページ集合からのポストおよびコメント自動分離抽出手法
  12. 教師情報を必要としないニュースページ群からのコンテンツ自動抽出

解説論文等(招待論文)

  1. 集合知による新たな研究評価
  2. レファレンス協同データベースの登録事例から垣間見る日本のレファレンスサービス
  3. ソーシャル言及数で論文に新たな評価軸
  4. オルトメトリクスは論文評価を変えるか -ソーシャルメディアで算出する新たな指標-
  5. 計量書誌学の新たな挑戦 -国産オルトメトリクス計測サービスの開発-
  6. ソーシャルメディアの政治的活用 ―活用事例と分析事例から―

国際会議・ワークショップ(査読有り)

  1. Analysis of the Influence of Internet TV Station on Wikipedia Page Views
  2. Analysis of User Dwell Time on Non-News Pages
  3. Analysis of Bias in Gathering Information Between User Attributes in News Application
  4. Analysis of Information Polarization During Japan's 2017 Election
  5. Analysis of Political Party Twitter Accounts' Retweeters During Japan's 2017 Election
  6. Analysis of User Dwell Time by Category in News Application
  7. Journal Name Extraction from Japanese Scientific News Articles
  8. Information Diffusion Power of Political Party Twitter Accounts During Japan's 2017 Election (short)
  9. Non-overlapping Counting of String Using Suffix Array
  10. Direct Estimation of Likelihood Ratio for the Analysis of Context
  11. Response Collector: A Video Learning System for Flipped Classrooms
  12. Diversity of Political Information Received by Political Detachment Users on Social Media (poster)
  13. VR System for Spatio-Temporal Visualization of Tweet Data
  14. Visualization of diffusion behavior pattern of influencers by genre on SNS (short)
  15. Do Political Detachment Users Receive Various Political Information on Social Media?
  16. Visualization of diffusion behavior patterns on Twitter (poster)
  17. Spatio-Temporal Visualization of Tweet Data Using VR (poster)
  18. Temporal Analysis of Online Social Graph by Home Location (short)
  19. Spatio-Temporal Visualization of Tweet Data around Tokyo Disneyland Using VR (poster)
  20. Feature Selection for Composer Classification Method using Quantity of Information
  21. When Do Users Change Their Profile Information on Twitter?
  22. Home Location Estimation Using Weather Observation Data
  23. Computing Information Quantity as Similarity Measure for Music Classification Task
  24. Finding Association Rules by Direct Estimation of Likelihood Ratios
  25. Can We Estimate Others' Friendships with a Single Interaction Features on Twitter? (short)
  26. Polysemy Detection in Distributed Representation of Word Sense
  27. Uncovering Information Flow Among Users by Time-Series Retweet Data: who is a friend of whom on Twitter?
  28. Preliminary Investigation for Japanese Comic Analysis using Wikipedia (poster)
  29. Analysis of Home Location Estimation with Iteration on Twitter Following Relationship
  30. Improving Compression Based Dissimilarity Measure for Music Score Analysis
  31. Realizing Half-Diminished Reality from Video Stream of Manipulating Objects
  32. Using Conservative Estimation for Conditional Probability instead of Ignoring Infrequent Case
  33. Decision Tree Analysis of Tourists' Preferences Regarding Tourist Attractions Using Geotag Data from Social Media (note)
  34. Confidence Interval of Probability Estimator of Laplace Smoothing
  35. Wikipedia Page View Reflects Web Search Trend (poster)
  36. Patterns in Interactive Tagging Networks
  37. Why Do You Follow Him? Multilinear Analysis on Twitter (poster)
  38. Exploiting Twitter for Spiking Query Classification

国内会議・ワークショップ(査読有り)


Photo by Kazuyuki Shudo
  1. 物体を操作する映像におけるHalf-Diminished Realityの実現 (ショート発表)
  2. トレンドキーワードに関するウェブリソースの横断的分析
  3. Webニュースを用いた未来情報年表の自動構築 (ポスター発表)
  4. CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得

国内会議・ワークショップ(査読無し・受賞関係のみ抜粋)

  1. ツイッターにおける政党公式アカウントのフォロワー特性分析
    • 鳥海不二夫, 吉田光男
    • ARG 第12回Webインテリジェンスとインタラクション研究会
    • 2018年6月17日(日)~18日(月) at 大久野島休暇村(広島県竹原市)
    • 優秀研究賞
  2. 検索行動量を用いた状態空間モデルによる自動車販売台数の予測
  3. NGA2015におけるユーザの情報収集と回遊行動の分析
  4. 重力モデルとTF-IDFを用いたジオタグ付きTwitterデータからの観光地抽出と魅力の評価
  5. Twitter位置情報・テキスト情報を用いた人の移動モデル構築と観光地推薦手法の提案
  6. 対象サービスに特化した日本語Webスペルチェッカーの開発 (データチャレンジ)
  7. 教師情報を必要としないWebページ群のコンテンツ自動抽出ツールの提案

その他の発表は researchmap の Misc をご覧ください

招待講演等

  1. 産学連携によるコンテンツマーケティング技術の研究開発
  2. NGA2015におけるユーザの情報収集と回遊行動の分析
  3. Twitter位置情報・テキスト情報を用いた人の移動モデル構築と観光地推薦手法の提案
  4. ウェブマイニングのためのデータ収集と保存
  5. 不揃いなデータ達の分析を行う前のTips ― ウェブデータの収集と保存 ―
  6. トレンドと検索頻度とWikipediaページビューの三角関係
  7. 楽しい楽しい研究開発
  8. オルトメトリクスとは何か
    • 吉田光男
    • 平成26年度茨城県図書館協会大学図書館部会研修会
    • 2014年11月27日(木) at 筑波大学(茨城県つくば市)
  9. ソーシャルメディア上での学術文献の流通
  10. 学際的な研究とスタートアップ企業との産学連携
  11. 情報技術者・研究者の生きる道
    • 吉田光男
    • お茶の水女子大学附属高等学校 総合的な学習の時間「図書館情報メディア研究」
    • 2014年2月19日(水) at お茶の水女子大学附属高等学校(東京都文京区)
  12. 文献管理Tipsセミナー ―Mendeleyを使って―
    • 吉田光男
    • 筑波大学附属図書館 図書館講習会
    • 2013年7月16日(火) at 筑波大学(茨城県つくば市)
  13. 研究者から見た Mendeley
  14. 自然言語処理における企業と大学と学生の関係
  15. 開発運営を続ける楽しさ ~ニュース検索サイト CEEK.JP NEWS の開発を通じて~
  16. Web検索エンジンと共に
  17. 技術系サービスができるまで“日本発の検索エンジン”
    • 第2回WAZA CTOセミナー
    • 2006年7月29日(土) at 東京国際フォーラム(東京都千代田区)

学位論文

  1. ウェブ検索エンジンのためのテキスト種別特定に関する研究
  2. ブログページ集合からのポスト及びコメント自動分離抽出手法の研究
  3. 教師情報を必要としないWebページ群のコンテンツ自動抽出

ソフトウェア・デモシステム

  1. 未来情報年表
  2. ExtractUniqueBlock - コンテンツ抽出(本文抽出) Perl モジュール

その他

  1. 日本学術振興会特別研究員(DC1)申請書
    • 2011年
  2. 第17回WI2研究会 学生参加報告

受賞・表彰

  1. Hayato Okumoto, Mitsuo Yoshida, Kyoji Umemura, Yuko Ichikawa. The 2018 International Conference On Advanced Informatics: Concepts, Theory And Application, Best Paper Award, August 2018.
  2. 鳥海不二夫, 吉田光男. 第12回Webインテリジェンスとインタラクション研究会, 優秀研究賞, 2018年6月.
  3. 佐藤翔, 吉田光男. 情報知識学会, 第15回論文賞, 2018年5月.
  4. 山口太一, 角田孝昭, 吉田光男, 津川翔, 山本幹雄. 第3回コミュニケーションクオリティCQ基礎講座ワークショップ, 最優秀研究賞, 2017年1月.
  5. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 第9回Webインテリジェンスとインタラクション研究会, ステージ発表賞, 2016年12月.
  6. 吉田光男, 荒瀬由紀. 第9回 Webとデータベースに関するフォーラム, 論文賞 runners-up, 2016年9月.
  7. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 人工知能学会, 研究会優秀賞, 2016年6月.
  8. 風間一洋, 谷直樹, 榊剛史, 吉田光男. 第7回Webインテリジェンスとインタラクション研究会, 萌芽研究賞, 2015年11月.
  9. 前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠. 第7回Webインテリジェンスとインタラクション研究会, 学生奨励賞, 2015年11月.
  10. 吉田光男. 日本学生支援機構, 特に優れた業績による返還免除(半額), 2011年5月.
  11. 吉田光男. 筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻, 専攻長表彰, 2011年3月.
  12. 角田孝昭, 澤田健都, 吉田光男. 第3回楽天研究開発シンポジウム, 最優秀データチャレンジ賞, 2010年12月.
  13. 吉田光男, 乾孝司, 山本幹雄. 楽天研究開発シンポジウム2009, 優秀論文賞, 2009年11月.
  14. 吉田光男, 山本幹雄. 第1回データ工学と情報マネジメントに関するフォーラム, 優秀インタラクティブ賞, 2009年3月.

研究資金(外部資金)

競争的外部資金(科研費)

  1. 日本学術振興会, 科学研究費補助金(若手研究(B)・代表). ソーシャルメディアにおける学術文献言及量予測モデルの構築. 2016年4月-2018年3月. (2019年3月まで延長)
  2. 日本学術振興会, 科学研究費補助金(基盤研究(C)・分担). 地方議会会議録を核とした発言地域情報付きテキストコーパスの定量分析. 2017年4月-2020年3月. (2018年から参加)
  3. 日本学術振興会, 科学研究費補助金(基盤研究(C)・分担). ソーシャルメディアにおける情報伝達現象理解のためのネットワーク解析と可視化. 2017年4月-2020年3月.
  4. 日本学術振興会, 科学研究費補助金(基盤研究(B)・分担). 議論の背景・過程・結果を関連づける地方政治コーパスの構築とその学際的応用. 2016年4月-2020年3月.
  5. 日本学術振興会, 科学研究費補助金(基盤研究(B)・分担). 歴史認識・領土問題を巡る世論とメディア環境に関する学際的日韓比較研究. 2015年7月-2019年3月. (2016年から参加)
  6. 日本学術振興会, 科学研究費補助金(特別研究員奨励費・代表). 時空間メタデータ検索をキーワード検索に統合したウェブ検索エンジンの実現. 2011年4月-2014年3月.

競争的外部資金(科研費以外)

  1. 国立情報学研究所, 平成30年度国立情報学研究所公募型共同研究. 科学報道記事の信頼性分析のための典拠文献自動探索. 2018年4月-2019年3月.
  2. 国立情報学研究所, 平成29年度国立情報学研究所公募型共同研究. ウェブにおける言及行動をもとにした学術雑誌の評価. 2017年4月-2018年3月.
  3. 国立情報学研究所, 平成28年度国立情報学研究所公募型共同研究. 学術情報サービスにおける閲覧行動とウェブにおける言及行動を横断した文献注目度の分析. 2016年4月-2017年3月.
  4. 楽天技術研究所, 研究奨励金(楽天研究開発シンポジウム2009). CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得. 2009年11月.

競争的資金(学内)

  1. 豊橋技術科学大学, 平成30年度高専連携教育研究プロジェクト. 学校間の関係性を明示するシラバス横断閲覧システムの開発(長野工業高等専門学校 苅米志帆乃). 2018年6月-2019年3月.
  2. 豊橋技術科学大学, 平成29年度高専連携教育研究プロジェクト. ニューラルネットワークによる顔文字の原形推定(明石工業高等専門学校 奥村紀之). 2017年6月-2018年3月.
  3. 豊橋技術科学大学, 平成28年度高専連携教育研究プロジェクト. シラバスに対する高度検索閲覧システムの開発(長野工業高等専門学校 苅米志帆乃). 2016年7月-2017年3月.
  4. 豊橋技術科学大学, 平成27年度教育研究活性化経費. ソーシャルメディアを用いた学術文献評価指標の開発. 2015年7月-2016年3月.

民間企業等共同研究(共同研究費あり)

太字は継続中の研究資金です。民間企業との共同研究も積極的に実施しており,特に新規事業のための研究開発に携わるケースが多いです(自身も起業経験があり,会社代表を兼業しています)。お気軽にお問い合わせください。

メディア掲載

  1. 需要計測・予測の精度向上 豊橋技科大とグノシー アルゴリズム開発. 『日刊工業新聞』2017年12月7日, 27面(大学・産学連携), 2017.
  2. ウェブコンテンツの需要計測・予測アルゴリズム、豊橋技科大とグノシーが開発へ. 『日刊工業新聞(電子版)』2017年12月7日, 2017.
  3. 玉置亮太. クリックベイト撲滅へ、グノシーが新しいアルゴリズム. 『日経コンピュータ(ITPro)』2017年11月29日, 2017.
  4. 藤田彰彦. “釣り記事”解決策に期待 グノシー社と算法開発の研究 豊橋技科大吉田助教. 『東愛知新聞』2017年11月28日, 2面(社会・経済), 2017.
  5. 太田智美. Gunosy、“釣り記事”見分けるアルゴリズム開発へ. 『ITmedia』2017年11月27日, 2017.
  6. 日本の学協会誌掲載論文のオルトメトリクス付与状況(論文紹介). 『STI Updates』2017年05月26日, 2017.
  7. 日本の学協会誌掲載論文のうち、ソーシャルメディアから言及されているものは約1~2%(文献紹介). 『カレントアウェアネス・ポータル』2017年05月16日, 2017.
  8. Wikipedia page views show online search trends. 『MyBroadband.co.za』September 10, 2015, 2015.
  9. Martin Anderson. Wikipedia page views a potential key to open source web trends data. 『The Stack』September 9, 2015, 2015.
  10. スマートアプリ、豊橋技術科学大学と人工知能型アグリゲーション技術の共同研究を開始. 『Social Game Info』2015年07月06日, 2015.
  11. 籠谷千穂. スマートアプリ、豊橋技術科学大学と産学共同研究を開始. 『GameBusiness.jp』2015年07月01日, 2015.
  12. 求められるのは、 ユーザーの疑問や悩みを解決するコンテンツ. 『宣伝会議 2014年12月号』2014年11月01日, pp.38-39, 2014.
  13. 木村俊介. 〈結婚未満〉「ポスドク問題」で結婚には慎重に. 『朝日新聞』2012年04月28日, 週末be(青色), 4面, 2012.
  14. 漆間泰志. 検索システム、実力PR(JAPAN ITの異才たち). 『日経産業新聞』2010年05月18日, 6面, 2010.
  15. 福光恵. ネット次世代の原石たち. 『日経クリック』2007年02月08日(日経ベストPC+デジタル, vol.12, no.4), p.21, 2007.
  16. 田口元. 既存のサービスの不満な点を改良したい――CEEK.JP・吉田光男さん. 『ITmedia』2007年01月30日, 2007.

他にもサービス(Ceek.jp, Ceek.jp News, Simple Fon Maps など)が雑誌にて多数紹介されています。

教育関係

教育歴(授業担当)

教育職員免許状

ティーチング・アシスタント(TA)

連絡先

E-Mail
yoshida [at] cs {dot} tut [dot] ac (dot) jp
Skype
ceekz_skype

所属・活動

豊橋技術科学大学

有限会社てっくてっく

学会・研究会

太字は継続中の委員です。

ワークショップ等

太字は継続中の委員です。

査読経験

座長経験

その他

外部サイト