Publications

(2024). Description-based Controllable Text-to-Speech with Cross-Lingual Voice Control. Submitted to ICASSP2025.
(2024). LibriTTS-P: A Corpus with Speaking Style and Speaker Identity Prompts for Text-to-Speech and Style Captioning. In Proc. Interspeech 2024.
(2023). PromptTTS++: Controlling Speaker Identity in Prompt-Based Text-to-Speech Using Natural Language Descriptions. In Proc. ICASSP2024.
(2023). Lightweight and High-Fidelity End-to-End Text-to-Speech with Multi-Band Generation and Inverse Short-Time Fourier Transform. In Proc. ICASSP2023.
(2022). 混合Differentiable Digital Signal Processingモデルによる合成パラメータ抽出のためのラウドネスの時間変動に基づくロス関数の設計. 日本音響学会 2022年秋季研究発表会.
(2022). Differentiable Digital Signal Processing Mixture Model for Synthesis Parameter Extraction from Mixture of Harmonic Sounds. In Proc. ICASSP2022.
(2022). 混合Differentiable DSPモデルによる混合楽器音からの合成パラメータ抽出の実験的評価. 日本音響学会 2022年春季研究発表会.
(2021). 楽譜情報を援用した音楽音響信号に対する混合Differentiable DSPモデルの合成パラメータ推定. 情報処理学会研究報告.
(2021). Contrastive Response Pairs for Automatic Evaluation of Non-task-oriented Neural Conversational Models. In Proc. SIGDIAL.
(2021). ニューラル対話モデルの自動評価に向けた対照応答対評価セットの試作. 言語処理学会第27回年次大会.