index.html

<html>
  <head>
    <meta charset="UTF-8">
    <title>NCSOFT Speech AI</title>
    <link rel="shortcut icon" href="images/nc.png">
    <style type='text/css'>
    span.paper_date {
      font-style: bold;
    }
    span.paper_title {
      font-style: italic;
    }
    /* Solid border */
    hr.solid {
      border-top: 3px solid #bbb;
    }
    </style>
  </head>
  <body>
    <h1>
      <img src="images/ncsoft_ci.jpg" width="200" height="132"/><br/>
      NCSOFT Speech AI
    </h1>
    <h2>Publications</h2>

    <article>
      <header>
        <span class="paper_date"><b>(2024)</b></span><span class="paper_title">&nbsp;MultiVerse: Efficient and Expressive Zero-Shot Multi-Task Text-to-Speech, Accepted by EMNLP 2024</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/multiverse/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <hr class='solid'>

    <article>
      <header>
        <span class="paper_date"><b>(2023)</b></span><span class="paper_title">&nbsp;Synthe-Sees: Face based Text-to-Speech for Virtual Speaker, Accepted by ICASSP 2024</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/Synthe-sees/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <hr class='solid'>

    <article>
      <header>
        <span class="paper_date"><b>(2022)</b></span><span class="paper_title">&nbsp;Avocodo: Generative Adversarial Network for Artifact-free Vocoder, Accepted by AAAI 2023</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/Avocodo/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>
    
    <article>
      <header>
        <span class="paper_date"><b>(2022)</b></span><span class="paper_title">&nbsp;Enhancement of Pitch Controllability using Timbre-Preserving Pitch Augmentation in FastPitch, Accepted by Interspeech 2022</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/vocgan-ps-fastpitch/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>
    
    <article>
      <header>
        <span class="paper_date"><b>(2022)</b></span><span class="paper_title">&nbsp;Hierarchical and Multi-Scale Variational Autoencoder for Diverse And Natural Speech Synthesis, Accepted by Interspeech 2022</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/himuv-tts/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>


    <article>
      <header>
        <span class="paper_date"><b>(2022)</b></span><span class="paper_title">&nbsp;Adversarial Multi-Task Learning for Disentangling Timbre and Pitch in Singing Voice Synthesis, Accepted by Interspeech 2022</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/amtl-svs/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <hr class='solid'>
    
    <article>
      <header>
        <span class="paper_date"><b>(2021)</b></span><span class="paper_title">&nbsp;GANSpeech: Adversarial Training for High-Fidelity Multi-Speaker Speech Synthesis, Accepted by Interspeech 2021</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/ganspeech/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2021)</b></span><span class="paper_title">&nbsp;FastPitchFormant: Source-filter based Decomposed Modeling for Speech Synthesis, Accepted by Interspeech 2021</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/fastpitchformant/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2021)</b></span><span class="paper_title">&nbsp;N-Singer: Non-Autoregressive Korean Singing Voice Synthesis System for Pronunciation Enhancement, Accepted by Interspeech 2021</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/nsinger/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2021)</b></span><span class="paper_title">&nbsp;Hierarchical Context-Aware Transformers for Non-AutoRegressive Text to Speech, Accepted by Interspeech 2021</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/hierarchical-transformers-tts/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2021)</b></span><span class="paper_title">&nbsp; A NEURAL TEXT-TO-SPEECH MODEL UTILIZING BROADCAST DATA MIXED WITH BACKGROUND MUSIC, Accepted by ICASSP 2021 </span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/tts-with-bgm-data/index.html">Demo page</a></li>
        </ul>
      </header>
    </article>

    <hr class='solid'>

    <article>
      <header>
        <span class="paper_date"><b>(2020)</b></span><span class="paper_title">&nbsp;Detecting Mismatch Between Text Script and Voice-Over Using Utterance Verification Based on Phoneme Recognition Ranking, pp. 8264??268, ICASSP 2020</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/apr-based-uv/index.html">Paper & Presentation</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2020)</b></span><span class="paper_title">&nbsp;VocGAN: A High-Fidelity Real-time Vocoder with a Hierarchically-nested Adversarial Network, pp. 200-204, Interspeech 2020</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/vocgan/index.html">Paper & Demo</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2020)</b></span><span class="paper_title">&nbsp;Speaking Speed Control of End-to-End Speech Synthesis using Sentence-Level Conditioning, pp. 4402-4406, Interspeech 2020
</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/speed-controllable-tts/index.html">Paper & Demo</a></li>
        </ul>
      </header>
    </article>


    <article>
      <header>
        <span class="paper_date"><b>(2020)</b></span><span class="paper_title">&nbsp; Effective Emotion Transplantation in an End-to-End Text-to-Speech System, IEEE Access, vol. 8, pp. 161713-161719, 2020.</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/emotion-tts/index.html">Paper & Demo</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2020)</b></span><span class="paper_title">&nbsp;WaveGlowGAN: the bipartite flow based vocoder with generative adversarial networks for high quality speech synthesis (Submitted)</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/waveglowgan/index.html">demo page</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2020)</b></span><span class="paper_title">&nbsp; Improving End-to-end Korean Voice Command Recognition using Domain-specific Text (Submitted)</span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/domain-specific/index.html">demo page</a></li>
        </ul>
      </header>
    </article>

    <article>
      <header>
        <span class="paper_date"><b>(2020)</b></span><span class="paper_title">&nbsp; Multi-task Learning using Morphological Information for End-to-end ASR (Submitted) </span>
        <ul>
          <!-- <li><a href="paper_link">paper</a></li> -->
          <li><a href="publications/morphological/index.html">demo page</a></li>
        </ul>
      </header>
    </article>


  </body>
</html>