DangerezBot
Onbekende woorde projek
wysigOnbekende woorde deur Gebruikerbespreking:DangerezBot identifiseer
wysigDie volgende woorde kom nie in my Afrikaanse korpus voor nie:
- academica (Latyns of Grieks)
- acanthopterygii (Latyns of Grieks)
- actinopterygii (Latyns of Grieks)
- acton(en)
- adamstown(en)
- afrikaanseskrywer
2 woorde
- afrikanerstaat
- afrikanerstate
- afrikastate
- alofi ??
- anale
- animalia(en)
- apartheidregering
apartheidsregering
- apia ?
- aptekerswet
eerder-- Wet op aptekers
- arbeidintensief
arbeidsintensief
- arrest(en)
- arrested(en)
- atmore(en)
- avarua
- bass(en)
- basutoland(en)
- berillium
- betfage ??
- Bethanië
- Betsjoeanaland
- betug
- bibliques(en)
- binomiale
- biologiesespesie
2 woorde
- boerderymasjinerie
- boerderywerke
- botspesifikasies
- breit ----konteks?
- bufferstate
- canberra(en)
- cannabis
- cannafariër
- capitalism(en)
- carfax(en)
- carradine(en)
- charged(en)
- chordata(en)
- consolidated(en)
- coolies(en)
- couple(en)
- cuvier(en)
- daggabeweging
- daggadag
- daggadebatte
- daggafarian(en)
- daggafarianisme
- daggafariër
- daggafariërs
- daggakop
- daggakultuur
- daggaoortredings
- daggapaartjie
- daggaplant
- daggaregte
- daggaregulasie
- daggaroker
- daggaverbod
- daggaverboddebat
- daggaverwante
- daggawetgewing
- daggawette
- dangerezbot
- debates(en)
- deelsaaiery
- delwers
- denkwaardige
- diamandmynbou
- diamantmyne
- dimidiatus (Latyns of Grieks)
- distopiese ?
- dongas
- doping(en)
- drive(en)
- dusa ?
- dynamics(en)
- Eckstein =eienaam
- eetvis
- endless(en)
- epinephelinae (Latyns of Grieks)
- epinephelus (Latyns of Grieks)
- eukaryota (Latyns of Grieks)
- filum
- fishbase(en)
- fishes(en)
- funafuti (Latyns of Grieks)
- geannekseerde
- gebruikersblad
- gedragveranderinge
- getweet
- getypoele
- gewolg ?
- gnathostomata (Latyns of Grieks)
- Goniwe =eienaam
- goudriwwe
- goudstormloop
- hagåtña (Sweeds/Noors?)
- hanga ?
- hashtag(en)
- heemstra
- heindrich
- hennepfariër
- heroeping
herroeping
- hi ("slang")
- highway(en)
- historiiques (? foreign lang.)
- honiara(en)
- honolulu
- hoofraadgewer
- hutbelasting
- huxley(en)
- immigrants(en)
- indian(en)
- indiërslawe
- industrialisation(en)
- industrialisering
- infrafilum
- infraklas
- insperasie
inspirasie
- iubn =akroniem
- jaargang
- jeugverhale
- josina
- journey(en)
- kampongs
- kasaks
- kasakstan
- kimbrly
Kimberly
- kleinboerestand
- koerantberigte
- korpus
- labroides
- lakey ? lakei
- landboustate
- lappieskombers
- lessing ?
- leërskare
- ln
- localités (Italiaans?)
- lätti (German?)
- majuro
- making(en)
- malema (EFF-leier)
- masjienopsigters
- massamigrasie
- matāʻutu
- medemense
- melekeok ?
- memoirs
- middelklasboere
- mille
- millennia
- mines(en)
- moderasie
- moresby
- morgans(en)
- mua ?
- neopterygii (Latyns of Grieks)
- notice(en)
- nouméa
- nukuʻalofa
- octagon (en)
- oman =pleknaam
- omgewingskade
- omheinde
- ongespesifiseerde
- onkruidwet
- ontwettig
- onvolwassenes
- oopgroefmynbou
- oorweiding
- opelugtronke
- opgekoop
- opiumkonferensie
- oppervlakneerslae
- oseanië
- oseaniëgeografie
- oseanogeografie
- oskemen ??
- osteichthyes (Latyns of Grieks)
- oulitnet
- pago ??
- palestine(en)
- palikir ??
- papeete ??
- participants (en)
- paterson =naam
- pediland
- perciformes(en)
- politechnice
- politics(en)
- possitief
positief
- pothead(en)
- programeerings
programerings
- psigotiese
- raided(en)
- rally(en)
- rasgbaseerde
- rastafariër
- rastakultuur
- rathbone(en)
- reddersburg
- regeering
regering
- relinquish(en)
- resistance(en)
- rev(en)
- reëlmatige
- ricad
- riic
- riku
- roa
- rolverdeling
- rooilys
- rooisee
- sagteband
- saipan
- Salomonseilande
- sanac =afkorting
- sanctuaires(en)
- sarasota(en)
- sativa (Latyns)
- serranidae (Latyns of Grieks)
- shireen(en)
- skatgrawers
- skrifgedeeltes
- skubaduikers
- slingerpad
- smoking(en)
- solomoneilande
Salomonseilande
- spenasie
spinasie
- spesiesbeenvisse
2 woorde
- spookstories
- spoorverbindings
- staatsbestelle
- statussimbole
- stemblad
- stilswyende
- stobbs(en)
- stofwinde
- stoomenjins
- streeksekonomieë
- subfamilie
- subfilum
- subklas
- superklas
- superorde
- suva ?
- takudzwa ?
- tantalum(en)
- teleostei (Latyns of Grieks)
- toegesak
- tukula(en)
- Tuscaloosa (Amerikaanse plek)
- tydchronologie
- tydsone
- tyen ?
- uitgekoop
- uitweë
- unchallenged(en)
- utc (Engelse afkorting)
- verig
verrig
- vermaerd
- verslagte
- vertebrata (Latyns of Grieks)
- vervloekte
- verwyderingplantjiesesoterie
- verwyderingsbeleid
- vila
villa
- visfamilies
- voortgehoue
- vyfjaarlikse
- weesbladsy
- weldadige ? (geweldadige ?)
- wernher ?
- wetsveranderinge
- winkende
- worldcat(en)
- yaren (foreign)
- zanecchia (Latyns of Grieks)
- zoeloemans
- δ
- өскемен (Russies)
My databasis bevat tans 119529 woorde. --DangerezBot (kontak) 11:37, 3 September 2017 (UTC)
Dankie Aliwal2012
wysigBaie dankie vir jou bydrae Aliwal2012, dit gaan baie help om die korpus te verbeter. Ek is tans besig om nog die hele wiki woordeskat na te gaan en DangerezBot trek nou by die 17de eeu--MickeyDangerez (kontak) 10:25, 4 September 2017 (UTC)
Kennisgewing
wysigJammer dat ek so stil is op die Wiki ek is besig op die Engelse Wiki terwyl DangerezBot die Afrikaanse Wikipedia skraap vir alle woorde wat daarop gebruik word. Tans staan die lys op oor die 300 000 verskillende woorde en is nou eers by Bessie dit wil se 13.35% van al die inhoud op die Afrikaanse Wikipedia. Wanneer die skraap klaar is sal die nuwe Afrikaanse Wikipedia Korpus verwerk word om alle foute en andertalige woorde te verwyder, daarna moet spelling nagegaan word aangesien daar spelfoute kan voorkom op huidige artikels. Wanneer hierdie proses klaar is sal dit die grootste databasis van Afrikaanse woorde wees. Dit sal dan onder die Commons Contributors Share Alike lisensie in die publiek vrygestel word. Om hirdie projek 'n sukses te maak gaan ek hulp nodig he om van die woorde na te gaan. Ek hoop jul is so opgewonde soos wat ek is terwyl ek dit programmeer.--MickeyDangerez (kontak) 21:03, 5 September 2017 (UTC)