大学の授業であったプロジェクト演習がかなり楽しかったので、ブログに残しておく。
プロジェクト演習とは?
まず、プロジェクト演習とは、希望したコースに配属されるゼミのようなものです。僕は、データ工学の演習に配属されました。他には、kaggleのような形態のものや、デジタルファブリケーションで作品を作る演習などがありました。
データ工学の内容
僕が配属されたコースの内容は、データ解析を持ちた新規システムの提案を行うと言ったものでした。4人グループに分かれ、企画から論文作成、プレゼンまでを行うというものでした。
僕たちのグループは、「飲食店レビューにおける評価項目別自動スコアリング」というタイトルで発表に向けて取り組みました。
取り組んだ内容
まず「飲食店レビューにおける評価項目別自動スコアリング」について少し説明をしておきます。
背景
ユーザが飲食店に行く際、食べログなどの飲食店レビューサイトのレビューを参照することが一般的です。しかし、サイトにあるレビュー数は多いため、ユーザが興味のある情報を見つけるのに時間がかかります。また、全てのレビューに目を通すことは大変という背景がありました。
目的
項目ごとに分けて、0〜7の8段階評価をし、グラフで視覚的にわかりやすく表示することで、ユーザが飲食店を決める際の負担と時間を軽減することが可能になります。こうすることで、食べログの既存システムよりもより優れたシステムを提案することを目的として研究を行いました。
担当役割
今回のグループでの取り組みにおいて、
-
進捗管理
-
プログラム
- 感情分析によるスコアリング→python
- スクレイピング →python
- プロトタイプ開発 →react.js, rechart.js
などを担当していました。
難しかったところ
今回の取り組みで難しかったところは、スコアリングを行うためのロジックをどうするかが一番難しかったです。結果として、辞書によるカラム一致でスコアを加算していく方法を取りました。
あとは、プロトタイプにrechart.jsを用いたのですが、発表まで時間がなかったため、コードが汚くかなり雑な作りになってしまいました。
上手くいったところ
一方で、上手くいったところとしては、余裕を持ってアンケートや資料作成などを行えたところです。取り組み開始直後から、ほぼ予定していた通りに進めることができました。残業もほぼなかった。(パチパチ)
改善点
今回、時間上の都合で、2つあるグラフのうち片方の実験しか行うことができませんでした。機会があればチャレンジしたい。
また、実験に用いたプログラム、辞書においても、精度が悪い項目があったため改善が必要という結果になりました。
結果
プロトタイプの作成を行い、UEQアンケート(20名)を取ったところ、提案システムは見栄え明快さ、効率、信頼性、刺激は良くノベルティも悪くないという結果になりました。
また、今回既存システムに対しても同様のUEQアンケートを取ったのですが、全体的にスコアが上昇していました。