0%

第 23 天,這幾天庫存真的用完了,所以文章都是最新鮮,當天寫的喔!! 剩下 7 天,一起加油吧!

終於來到了最後一個系列「Android APP 系列」,也就是真正裝在 Zenbo 上的「長照小幫手 APP」。很久沒有認真寫一個 APP 了,就當作順便練習,這次我選用了 MVVM 的架構。這個系列會以「長照小幫手」為例,從 MVVM 架構介紹開始,介紹 MVVM 的各個部分和一些系統中比較特別的功能。

閱讀全文 »

嗨! 昨天終於結束了語料庫模型建置的部分,再來就要建立 API 了。這個系統中我採用了一個比較特別的架構,伺服器是 Ubumtu + Apache + PHP,API 主要使用 PHP 撰寫,並由 PHP 去執行 Python 腳本(也就是前面建置的 TF-IDF 語料庫模型),再回傳結果。可以參考下圖。

閱讀全文 »

聊天機器人雖有問答集可以回覆大部分常見問題,但難免會有疏漏。因此本研究亦設計回饋機制,若使用者發現機器人的回覆內容不符合想預期,可以直接查看與問句第二和第三相似的問答組合,或是點選「以上皆非」選項,兩種方式系統都會自動記錄相關資訊。後續我們便可整理蒐集到的組合,持續優化聊天機器人與擴增問答集。

閱讀全文 »

今天的主題是介紹如何讀取 CSV (之前從各個網站爬下來的問答集),並將資料轉成後面製作語料庫模型要用的格式。

先複習一下之前爬下來的格式好了,待會我們要做的是以 Q (問題)來製作模型

閱讀全文 »

在語句中常會出現概念相似的詞,包括某類物品、地名、時間…等。例如,輪椅、拐杖、助行器、電動床都屬於輔具實體;早上、中午、下午、傍晚屬於時間實體。將這些詞語對應到所屬的類別,可以使程式判斷使用者意圖時更貼近。

閱讀全文 »

我們前面說過,中文不像英文,字與字中間與空白相間,所以中文句子要搭配 TF-IDF 前,需要先經過適當的斷詞。中文斷詞領域最常見的兩套工具就是 Jieba(結巴)和 CKIP 了。今天主要介紹我選擇 CKIP 而非 Jieba 的原因。

閱讀全文 »

還記得前幾天用爬蟲蒐集到的問答集嗎? 今天我們要來幫這些問答組合分類哦!

名詞定義:
問答組合: 指一組問題+回答,和其他有關於這個問答的相關資訊(來源URL、編號、分類)。
問答集: 多個「問答組合」組成問答集。

閱讀全文 »