篇名 | 基於端對端模型化技術之語音文件摘要 |
---|---|
卷期 | 25:1 |
並列篇名 | Spoken Document Summarization Using End-to-End Modeling Techniques |
作者 | 劉慈恩 、 劉士弘 、 張國韋 、 陳柏琳 |
頁次 | 029-056 |
關鍵字 | 語音文件 、 節錄式摘要 、 類神經網路 、 階層式語意表示 、 聲學特徵 、 Spoken Documents 、 Extractive Summarization 、 Deep Neural Networks 、 Hierarchical Semantic Representations 、 Acoustic Features 、 THCI Core |
出刊日期 | 202006 |
本論文主要探討端對端(End-to-End)的節錄式摘要方法於語音文件摘要任務上的應用,並深入研究如何改善語音文件摘要之成效。因此,我們提出以類神經網路為基礎之摘要摘要模型,運用階層式的架構及注意力機制深層次地理解文件蘊含的主旨,並以強化學習輔助訓練模型根據文件主旨選取並排序具代表性的語句組成摘要。同時,我們為了避免語音辨識的錯誤影響摘要結果,也將語音文件中相關的聲學特徵加入模型訓練以及使用次詞向量作為輸入。最後我們在中文廣播新聞語料(MATBN)上進行一系列的實驗與分析,從實驗結果中可驗證本論文提出之假設且在摘要成效上有顯著的提升。
This thesis set to explore novel and effective end-to-end extractive methods for spoken document summarization. To this end, we propose a neural summarization approach leveraging a hierarchical modeling structure with an attention mechanism to understand a document deeply, and in turn to select representative sentences as its summary. Meanwhile, for alleviating the negative effect of speech recognition errors, we make use of acoustic features and subword-level input representations for the proposed approach. Finally, we conduct a series of experiments on the Mandarin Broadcast News (MATBN) Corpus. The experimental results confirm the utility of our approach which improves the performance of state-of-the-art ones.