基於內容之機器推薦中文文章系統(Content-based Machine Recommender System in Chinese article)

問題定義

現代的小說推薦系統以及詩詞推薦系統都是利用collaborative-filter來做推薦,或是簡單的運用類型來做基礎的推薦,致使使用者無法得知自己想要閱讀的文章。此系統解決只運用content-based來推薦傳統中華文學,如詩詞和小說,可在不受別人喜好影響下推薦文章,並且在推薦的同時,可以快速了解此篇文章的基礎資訊,提供人以內容為導向閱讀自己喜歡的文章。

功能介紹

  • 推薦文章:兩種推薦方法,一種依循關鍵字和作者寫作風格推薦詩詞和小說,第二種為依尋關鍵字回傳詩詞和小說類別。
  • 產生文章:輸入狀況產生詩詞。
  • 文章概覽:可查詢和瀏覽詩詞的作者、風格、題目、年代、部份內容、FDA產物和文字內容難度。
  • 圖片支援: 在查詢階段,透過關鍵字提取找到相對應的圖片做支援,並加入文字雲讓人可以快速了解詩詞或小說內容。
  • 建立自己的Profile,來推薦不同類型的文章。
  • 與詩詞對話

推薦方法

  • First:
    • input: word
    • outputs: author(tag), article(tag)
    • ways: BERT(2 models), LDA
  • Second Search:
    • input: words or author
    • outputs: the article and similar words
    • ways: same words
  • Third:
    • input: Selected button(tag)
    • outputs: author(tag), article(tag)
    • ways: Selected LDA topic
  • Forth:
    • input: Selected picture, plus OCR
    • outputs: article
    • ways: OCR transform to text

Other function

  • 與文章對話(novel):
    • input: words
    • outputs: some words
    • ways: language model
  • 探討古人:
    • input: author
    • outputs: search result
    • ways: text to saved the text
  • Quick Look of article
    • input: title
    • outputs: words cloud
    • ways: wordclouds
  • Generate poem(poem):
    • input: situation
    • outputs: poem
    • ways: language model