Automatická klasifikace významových celků v judikatuře

Roč.11,č.21(2020)

Abstrakt

Příspěvek popisuje experiment se strojovým učením, kdy na minimálním datasetu bylo pomocí kombinace známých algoritmů strojového učení dosaženo relativně vysoké úspěšnosti klasifikace významových celků. Významovými celky se zde rozumí např. hlavička, procesní historie a argumentace stran.


Klíčová slova:
judikatura; strojové učení; počítačové zpracování přirozeného jazyka

Stránky:
s. 3–20
Biografie autora

Martin Eliášek

ATLAS Consulting, spol. s r.o.

právník-analytik

Jakub Kól

ATLAS Consulting, spol. s r.o.

data scientist

Miloš Švaňa

ATLAS Consulting, spol. s r.o.

programátor
Reference

[1] AGGARWAL, Charu C. a ChengXiang ZHAI. Mining text data. New York: Springer, 2012. ISBN 978-1-4614-3222-7. https://doi.org/10.1007/978-1-4614-3223-4_1

[2] HAN, Jiawei, Micheline KAMBER a Jian PEI. Data Mining: Concepts and Techniques. Third Edition. Waltham: Elsevier, 2011. ISBN 978-0-12-381479-1.

[3] HARAŠTA, Jakub, Jaromír ŠAVELKA, František KASL a Jakub MÍŠEK. Automatic Segmentation of Czech Court Decisions into Multi-Paragraph Parts. Jusletter IT. Weblaw AG, 2019, roč. 4, 23. Mai 2019, s. 1-10. ISSN 1664-848X. Dostupné z: https://www.muni.cz/en/research/publications/1534440

[4] MIKOLOV, Tomáš, Kai CHEN, Greg CORRADO a Jefrey DEAN. Efficient Estimation of Word Representations in Vector Space. CoRR, 2013. Dostupné z: https://arxiv.org/abs/1301.3781

[5] MIKOLOV, Tomáš a Quoc V. LE. Distributed Representations of Sentences and Documents. CoRR, 2014. Dostupné z: https://arxiv.org/abs/1405.4053

[6] RASCHKA, Sebastian. Python Machine Learning. Birmingham: Packt, 2015. ISBN 978-1- 78355-513-0.

Metriky

0


607

Views

196

PDF views