KoichiYasuoka

Professor of Digital Humanities

Institute for Research in Humanities, Kyoto University

KoichiYasuoka's Stars

chakki-works/sumeval
Well tested & Multi-language evaluation framework for text summarization.
Language:Python618 18 1858
polm/fugashi
A Cython MeCab wrapper for fast, pythonic Japanese tokenization and morphological analysis.
Language:C++426 8 7736
ikegami-yukino/mecab
Notice: This repository will be archived... This repository is for building Windows 64-bit MeCab binary and improving MeCab Python binding.
Language:C++251 11 516
explosion/tokenizations
Robust and Fast tokenizations alignment library for Rust and Python https://tamuhey.github.io/tokenizations/
Language:Rust190 10 1120
taishi-i/toiro
A comparison tool of Japanese tokenizers
Language:Python120 7 29
shenshen-hungry/Ancient-Chinese-Segmentation
A tool for ancient Chinese segmentation.
53 7 17
retarfi/language-pretraining
Pre-training Language Models for Japanese
Language:Python49 4 45
akirakubo/bert-japanese-aozora
Japanese BERT trained on Aozora Bunko and Wikipedia, pre-tokenized by MeCab with UniDic & SudachiPy
40 3 23
clarinsi/classla
CLASSLA Fork of the Official Stanford NLP Python Library for Many Human Languages
Language:Python40 5 4419
amir-zeldes/HebPipe
An NLP pipeline for Hebrew
Language:Lex36 2 2010
informatix-inc/bert
Language:Python28 0 12
megagonlabs/UD_Japanese-GSD
Japanese data from the Google UDT 2.0.
Language:Python28 1 02
megagonlabs/ginza-transformers
Use custom tokenizers in spacy-transformers
Language:Python16 5 35
ipipan/combo
Dependency Parsing library
Language:Python9 3 11
gossebouma/lassy2ud
Lassy Small to Universal Dependencies Conversion
Language:XQuery6 3 31
UniversalDependencies/UD_Japanese-GSDLUW
Long-unit-word version of UD_Japanese-GSD
3 142 11
UniversalDependencies/UD_Tatar-NMCTT
2 143 0

KoichiYasuoka

KoichiYasuoka's Stars

chakki-works/sumeval

polm/fugashi

ikegami-yukino/mecab

explosion/tokenizations

taishi-i/toiro

shenshen-hungry/Ancient-Chinese-Segmentation

retarfi/language-pretraining

akirakubo/bert-japanese-aozora

clarinsi/classla

amir-zeldes/HebPipe

informatix-inc/bert

megagonlabs/UD_Japanese-GSD

megagonlabs/ginza-transformers

ipipan/combo

gossebouma/lassy2ud

UniversalDependencies/UD_Japanese-GSDLUW

UniversalDependencies/UD_Tatar-NMCTT