/iceTaboo

An annotated collection of Icelandic words that are (sometimes) associated with a taboo or some sort inappropriateness in context..

Icelandic Taboo Database 1.0

An annotated collection of Icelandic words that are (sometimes) associated with a taboo or some sort of inappropriateness depending on context.

Citing the Taboo Database:

Ingason, Anton Karl, Lilja Björk Stefánsdóttir, and Agnes Sólmundsdóttir. 2020. The Icelandic Taboo Database. Version 1.0. (https://github.com/antonkarl/iceTaboo)

List of taboo/inappropriate words

A list of words in Icelandic that may in some way be considered inappropriate, taboo and/or loaded in use or meaning. These can be words such as; words that are biased against certain minorities (i.e. people of different races, abilities, genders or sexualities), words that are derogatory towards people, unnecessarily gendered, obsolete and so on. The list also includes words that are not very inappropriate but can be considered an unfortunate topic for children or politically loaded in any way. The words are grouped together in categories depending on either their meaning, form or use. Each word has then been marked with a short explanation (in Icelandic) on how they can be considered inappropriate and in what context. The words were collected through typical data collecting, but other similar lists from elsewhere were also used, i.e. a list of taboo words for children from Samrómur and a list of taboo words for children’s scrabble from Miðeind.

This list does not contain actual information or data on the real opinion of the public towards these words. These words are merely thought to elicit a bad opinion. This list can therefore be a good set of data for this kind of sentiment survey. The list will be a part of the Icelandic Error Corpus which is in progress by the research team in language technology of the University of Iceland (Mál og tækni) as well as an upcoming Spell Checker based on said corpus.

Listi yfir óviðeigandi orð

Listi af íslenskum orðum sem gætu talist óviðeigandi og/eða verið gildishlaðin á einhvern hátt. Það geta verið orð sem t.d. ýta undir mismunun gagnvart ákveðnum þjóðfélagshópum, teljast niðrandi þegar þau eru höfð um fólk, eru óþarflega kynjuð, teljast úrelt o.s.frv. Einnig eru orð á listanum sem teljast ekki beint óviðeigandi en gætu þótt óhentugt umræðuefni fyrir börn eða verið gildishlaðin á einhvern hátt. Á listanum eru orðin flokkuð í flokka ýmist eftir merkingu þeirra eða notkun og skráð hefur verið hvernig og í hvaða samhengi þau geta þótt óviðeigandi. Lista yfir flokkana og innihald þeirra má sjá hér fyrir neðan. Orðunum var safnað saman með hefðbundinni gagnasöfnun, en einnig var notast við svipaða lista annars staðar frá, þ.á.m. lista Samróms yfir orð sem þættu óæskilegt umræðuefni fyrir börn og listi Miðeindar yfir bannorð í netskrafli fyrir börn. Listinn er samansafn orða úr öllum áttum og er alls ekki tæmandi.

Þessi listi inniheldur ekki upplýsingar eða gögn um raunverulegt viðhorf almennings til þessara orða. Orðin eru aðeins talin geta verið líkleg til að teljast óviðeigandi af almenningi. Listinn er því hentugt gagnasafn fyrir slíkar viðhorfskannanir. Listinn mun tilheyra villumálheild sem rannsóknarstofan Mál og tækni við Háskóla Íslands vinnur að, og verður jafnframt notaður til að auka nákvæmni væntanlegs villuleitarforrits sem byggir á henni.

Óviðeigandi orð

Flokkar Kóðun Innihaldslýsing
Almennt óviðeigandi a Orð sem almennt teljast óviðeigandi í málinu, og falla ekki undir aðra flokka á listanum.
Blótsyrði b Orð sem notuð eru sem blótsyrði og slíkar upphrópanir - einnig orðasambönd og samsett orð sem innihalda slíka orðhluta.
Drykkju/dóp- orð d Niðrandi orð sem gefa í skyn að einstaklingur sé drykkfelldur eða haldinn einhverri fíkn - einnig önnur orð sem tengjast slíkri neyslu.
Fötlunarorð f Orð sem teljast niðrandi yfir einstaklinga með fötlun - hafa áður verið notuð en teljast úrelt í dag.
Heilbrigðistengt g Orð sem ekki eru talin viðeigandi í heilbrigðismálum og eru hlaðin fordómum - úrelt, t.d. um geðræn vandamál o.fl.
Heimsku-orð h Orð sem gefa í skyn fáfræði einstaklings, yfirleitt notuð sem meiðyrði eða á niðrandi hátt.
Kynjuð orð k Óviðeigandi orð sem eru kynjuð á einhvern hátt eða innihalda kynjaða orðhluta - geta átt við um manneskjur, einnig verið kynjuð orð yfir hversdagslega hluti
Kynjuð orð bara um karla k/kk Niðrandi orð sem eiga aðeins við um karla - geta sum verið notuð til að niðra annað fólk
Kynjuð orð bara um konur k/kvk Niðrandi orð sem eiga aðeins við um konur - geta sum verið notuð til að niðra annað fólk
Lýsingarorð (ljót um fólk) l Lýsingarorð yfir fólk, sem hafa neikvæða merkingu og gætu talist óviðeigandi. Lýsa neikvæðum atriðum í fari fólks (ekki útliti)
Fagheiti m Heiti yfir fagstéttir sem teljast úrelt og hafa tekið upp önnur heiti
Nafnorð (ljót um fólk) n Nafnorð yfir fólk, sem hafa neikvæða merkingu og gætu talist óviðeigandi. Almenn merking (ekki kynjuð og ekki um heimsku né drykkju/dóp)
Orðasambönd o Undirflokkur blótsyrða; föst orðasambönd sem notuð eru sem upphrópanir og blótsyrði.
LGBTQIA+ orð ö Niðrandi orð yfir hinsegin fólk, stundum notuð sem almenn meiðyrði
Sagnir s Sagnir sem fela í sér óviðeigandi verknað, eða eru notaðar á óviðeigandi hátt yfir annan verknað
Trúarorð t Óviðeigandi orð sem fela í sér einhvers konar trúarbrögð, geta verið gildishlaðin, geta innihaldið fordóma á ákveðna trúarhópa og jafnframt talist úrelt.
Útlit u Niðrandi orð um manneskju, draga fram neikvæða eiginleika í útliti.
Kynfæraorð v Nöfn á kynfærum, stundum notuð sem meiðyrði yfir fólk
Áhersluforskeyti w Áhersluforskeyti sem skeytt er framan á almenn orð, sem gera þau óviðeigandi t.d. Skíta-, mellu-; og orð sem innihalda þessa orðhluta
Kynlífstengd orð y Orð sem tengjast kynlífsgjörðum, sem teljast almennt óviðeigandi, t.d. Sifjaspell ofl.
Þjóðernisorð þ Niðrandi orð yfir fólk af mismunandi þjóðerni/kynþætti (sem gjarnan hafa verið undir kúgun og orðið fyrir fordómum) - einnig samsett orð sem innihalda slíka orðhluta

Misóviðeigandi orð

Flokkar Kóðun Innihaldslýsing
Óviðeigandi Börnum z Orð sem teljast almennt ekki óviðeigandi en gætu talist óviðeigandi umræðuefni fyrir börn.
Pólitísk orð i Pólitísk orð sem geta verið gildishlaðin og fólk með ólíkar skoðanir hefur mismunandi tilfinningar til - falla undir misóviðeigandi orðalistann
Ekki óviðeigandi e Orð sem ekki ættu að teljast óviðeigandi, en hafa flókna merkingu og hafa því verið síuð burt þegar börn taka þátt í ýmsu máltæknitengdu t.d. í Netskrafli eða hjá Samrómi
Önnur, ekki óviðeigandi, merking x Orð sem flokkuð hafa verið í aðra flokka sem óviðeigandi orð, en hafa aðra merkingu sem telst ekki óviðeigandi, t.d. Api 'heimskingi'= Óviðeigandi en Api ='dýrategund' ekki óviðeigandi

Uppsetning listanna er eftirfarandi:

orð orðflokkur kóði kóði2 merking Óviðeigandi ástæða Annað tilfallandi önnur merking (ekki óviðeigandi)
orð no/lo/so/ao kóði flokksins sem orðið tilheyrir annar kóði ef orðið fellur líka undir annan flokk merking orðsins hvernig orðið gæti talist óviðeigandi, t.d. í hvaða samhengi. aukaupplýsingar t.d. enskusletta, kyn orðsins o.fl. x (ef orðið hefur aðra merkingu sem er ekki óviðeigandi
dæmi:
api no h heimskur maður Niðrandi orð yfir manneskju sem dregur fram fáfræði einstaklingsins x (dýrategund)