Megjegyzés
Az itt található adatok NEM lesznek hasznára, hacsak nem valamilyen nyelvi eszközt programoz vagy adatokat dolgoz fel.
Ha egyszerűen csak olyan mondatokat szeretne, amelyek segítségével elsajátíthatja a nyelvet, nézze meg a listákat. Készíthet sajátot, vagy megtekintheti azokat, amelyeket mások készítettek. A listák letölthetők és kinyomtathatók.
Általános információ a fájlokról
Sok japán és angol mondat a Tanaka Korpusz-ból származik, amely közkincs.
Creative commons
Ezek a fájlok CC BY 2.0 FR alatt kerülnek kiadásra.
Mondataink egy része CC0 1.0 alatt is elérhető.
Hangfelvételre vonatkozó licencek
A hangfájlra vonatkozó licencet a készítője választja ki, és az azon az oldalon jelenik meg, amely felsorolja az összes általa hozzáadott hangfájlt.
Kérdésed van?
Ha kérésed vagy kérdésed akadna, nyugodtan fordulj hozzánk. Általában gyorsan válaszolunk.
Letöltések
Testreszabott exportok igény szerinti generálásához és letöltéséhez használhatod ezt az eszközt.
Az összes olyan A nyelvű mondat letöltése, ami le van fordítva B nyelvre; a fordításokkal együtt.
Mondatok
- Fájlnév
-
Összes nyelv Csak a következő nyelvű mondatok: abház adige afrihili afrikaans ainu ajmara Aklanon albán algériai arab alnémet alsó szorb amhara Ancient Hebrew angol arab aragonéz asszámi asszír újarámi asztúriai avadhi avar azerbajdzsáni bajor balinéz balucsi bambara Banjar baskír baszk Baybayanon belarusz bengáli berber Berom bhodzspuri bislama bodo bolgár bosnyák breton Brithenig burját burmai Central Bikol Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong chabacano chamorro Chinese Pidgin English cigány Cuyonon CycL csagatáj csecsen cseh cseroki csicseva csinuk zsargon csoktó csukcs csuvas dán dél-altaji dél-kurd déli haida déli számi déli szeszotó Drents dungan Dutton World Speedwords Eastern Armenian egyiptomi arab emilián Erromintxela erza észak malukui maláj északi fríz északi számi eszperantó észt eve Evenki nyelv Extremaduran felső szorb feröeri fidzsi fidzsii hindi finn főniciai francia friuli fríz ga gagauz galiciai gan kínai ganda Garhwali Geg albán nyelv gilberti (kiribati) gót görög Gronings grönlandi grúz Guadeloupean Creole French guarani gudzsaráti guerrero navatl Gulf Arabic haida haiti kreol hakasz hakka kínai haladzs hausza hawaii héber hegyi mari hiligajnon hindi Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho holland horvát Hunsrik iban ido igbó ilokano indonéz Interglossa interlingua inuktitut ír iraki arab Isan izlandi Izsór nyelv jakut jamaicai angol japán jávai Jewish Babylonian Aramaic Jewish Palestinian Aramaic jiddis Jin Chinese joruba judeo-tat Jukaték-maja nyelv K'iche' kabardi kabije kajuga kalmük kamba kannada kantoni kapampangan karacsáj-balkár karakalpak Karakhanid karelai kasmíri kasub katalán kazah kecsua Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut khászi khmer kínai kinyarvanda kirgiz kirundi klasszikus kínai klingon komi-permják Komi-Zyrian kongói szuahéli Konkani (Goa) koreai korni korzikai kotava Kölni közép dusun középangol középfrancia krími tatár kumük Kven Finnish láadan ladin ladino lakota lao Latgal nyelv latin láz lengyel lett Libyan Arabic ligur limburgi lingala lingua franca nova litván lív lojban lombard louisianai kreol Lushootseed luxemburgi macedón madurai magyar Mahasu Pahari maithili maláj malajálam Malay (Vernacular) maldív malgas máltai mambai mandzsu manx maori mapucse maráthi marokkói arab marokkói tamazight Marshall-szigeteki mauritiusi kreol mbundu (umbundu) Meitei mezei mari Middle Persian (Pahlavi) mikmak min nan kínai minangkabau Mingrél nyelv mirandéz mohauk (mohawk) moksán mon mongol Mono (USA) Muskogee (Creek) Naga (Tangshang) Nande nápolyi nauri navahó navatl német nepáli nevari Nigerian Fulfulde niuei nogaj North Levantine Arabic Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) norvég (bokmål) norvég (nynorsk) novial nuer Nyungar ó-keleti-szláv O'odham óangol occidental (interlingue) Odia (Oriya) odzsibva ófrancia ófríz ógörög okinavai nyelv okszitán olasz Old Aramaic Old Turkish óporosz orizabai navatl orosz óskandináv óspanyol ószász (óalnémet) oszét oszmán-török ótupi palaui pali pandzsábi (keleti) pandzsábi (nyugati) pangaszinan papiamento partmenti kadazan pastu pennsylvaniai német perzsa pfalzi német piemonti pikárd pipil portugál pulaar Qashqai quenya Rapa Nui Rendille rohingja román romans ruszin sanghaji Saterland Frisian scots Setswana seychelle-i kreol síksági krí sindarin skót gael sona South Levantine Arabic Southern Subanen Southern Zaza (Dimli) spanyol sumer susvap (szalis) sváb svájci német svéd szamoai szamogit nyelv szango szanszkrit szantáli szardíniai szebuano szecsuani ji szerb szicíliai sziléziai nyelv Sziloti nyelv szindhi szingaléz szír sziraiki szlovák szlovén szomáli szranai tongó szuahéli szundanéz szvázi ta-oih (ngeq) Tachawit tádzsik Tagal Murut tagalog Tahaggart Tamahaq tahiti Talossan Talysh tamil Tarifit Tashelhit tatár telugu Temuan tetum thai tibeti tigré tigrinya tok piszin tokelaui Toki Pona Tonga (Zambezi) tongai török tszonga tumbuka tuvai tuvalui türkmén Uab Meto udmurt ujgur ukrán urdu Urhobo üzbég vallon varaó velencei Vepsze nyelv vietnámi volapük volof võro walesi Wayuu Western Armenian xhosza xiang kínai zazaki Zeelandic zulu Ismeretlen nyelv - Fájl leírása
- Az összes mondatot tartalmazza a kiválasztott nyelven. Minden mondathoz egyedi azonosító és ISO 639-3 nyelvi kód tartozik.
- Mezők és formátum
- Mondat azonosítója (id) [tab] Nyelv [tab] Szöveg
Mondatok (részletes)
- Fájlnév
-
{{sentencesDetailed | filename}}
Összes nyelv Csak a következő nyelvű mondatok: abház adige afrihili afrikaans ainu ajmara Aklanon albán algériai arab alnémet alsó szorb amhara Ancient Hebrew angol arab aragonéz asszámi asszír újarámi asztúriai avadhi avar azerbajdzsáni bajor balinéz balucsi bambara Banjar baskír baszk Baybayanon belarusz bengáli berber Berom bhodzspuri bislama bodo bolgár bosnyák breton Brithenig burját burmai Central Bikol Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong chabacano chamorro Chinese Pidgin English cigány Cuyonon CycL csagatáj csecsen cseh cseroki csicseva csinuk zsargon csoktó csukcs csuvas dán dél-altaji dél-kurd déli haida déli számi déli szeszotó Drents dungan Dutton World Speedwords Eastern Armenian egyiptomi arab emilián Erromintxela erza észak malukui maláj északi fríz északi számi eszperantó észt eve Evenki nyelv Extremaduran felső szorb feröeri fidzsi fidzsii hindi finn főniciai francia friuli fríz ga gagauz galiciai gan kínai ganda Garhwali Geg albán nyelv gilberti (kiribati) gót görög Gronings grönlandi grúz Guadeloupean Creole French guarani gudzsaráti guerrero navatl Gulf Arabic haida haiti kreol hakasz hakka kínai haladzs hausza hawaii héber hegyi mari hiligajnon hindi Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho holland horvát Hunsrik iban ido igbó ilokano indonéz Interglossa interlingua inuktitut ír iraki arab Isan izlandi Izsór nyelv jakut jamaicai angol japán jávai Jewish Babylonian Aramaic Jewish Palestinian Aramaic jiddis Jin Chinese joruba judeo-tat Jukaték-maja nyelv K'iche' kabardi kabije kajuga kalmük kamba kannada kantoni kapampangan karacsáj-balkár karakalpak Karakhanid karelai kasmíri kasub katalán kazah kecsua Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut khászi khmer kínai kinyarvanda kirgiz kirundi klasszikus kínai klingon komi-permják Komi-Zyrian kongói szuahéli Konkani (Goa) koreai korni korzikai kotava Kölni közép dusun középangol középfrancia krími tatár kumük Kven Finnish láadan ladin ladino lakota lao Latgal nyelv latin láz lengyel lett Libyan Arabic ligur limburgi lingala lingua franca nova litván lív lojban lombard louisianai kreol Lushootseed luxemburgi macedón madurai magyar Mahasu Pahari maithili maláj malajálam Malay (Vernacular) maldív malgas máltai mambai mandzsu manx maori mapucse maráthi marokkói arab marokkói tamazight Marshall-szigeteki mauritiusi kreol mbundu (umbundu) Meitei mezei mari Middle Persian (Pahlavi) mikmak min nan kínai minangkabau Mingrél nyelv mirandéz mohauk (mohawk) moksán mon mongol Mono (USA) Muskogee (Creek) Naga (Tangshang) Nande nápolyi nauri navahó navatl német nepáli nevari Nigerian Fulfulde niuei nogaj North Levantine Arabic Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) norvég (bokmål) norvég (nynorsk) novial nuer Nyungar ó-keleti-szláv O'odham óangol occidental (interlingue) Odia (Oriya) odzsibva ófrancia ófríz ógörög okinavai nyelv okszitán olasz Old Aramaic Old Turkish óporosz orizabai navatl orosz óskandináv óspanyol ószász (óalnémet) oszét oszmán-török ótupi palaui pali pandzsábi (keleti) pandzsábi (nyugati) pangaszinan papiamento partmenti kadazan pastu pennsylvaniai német perzsa pfalzi német piemonti pikárd pipil portugál pulaar Qashqai quenya Rapa Nui Rendille rohingja román romans ruszin sanghaji Saterland Frisian scots Setswana seychelle-i kreol síksági krí sindarin skót gael sona South Levantine Arabic Southern Subanen Southern Zaza (Dimli) spanyol sumer susvap (szalis) sváb svájci német svéd szamoai szamogit nyelv szango szanszkrit szantáli szardíniai szebuano szecsuani ji szerb szicíliai sziléziai nyelv Sziloti nyelv szindhi szingaléz szír sziraiki szlovák szlovén szomáli szranai tongó szuahéli szundanéz szvázi ta-oih (ngeq) Tachawit tádzsik Tagal Murut tagalog Tahaggart Tamahaq tahiti Talossan Talysh tamil Tarifit Tashelhit tatár telugu Temuan tetum thai tibeti tigré tigrinya tok piszin tokelaui Toki Pona Tonga (Zambezi) tongai török tszonga tumbuka tuvai tuvalui türkmén Uab Meto udmurt ujgur ukrán urdu Urhobo üzbég vallon varaó velencei Vepsze nyelv vietnámi volapük volof võro walesi Wayuu Western Armenian xhosza xiang kínai zazaki Zeelandic zulu Ismeretlen nyelv - Fájl leírása
- Minden egyes mondat további mezőket tartalmaz (gondozó neve, létrehozás/módosítás dátuma).
- Mezők és formátum
- Mondat azonosítója (id) [tab] Nyelv [tab] Szöveg [tab] Felhasználónév [tab] Hozzáadás dátuma [tab] Utolsó módosítás dátuma
Eredeti mondatok és fordítások
- Fájlnév
- sentences_base.tar.bz2
- Fájl leírása
-
Minden mondatnál nyilván van tartva, hogy eredeti vagy egy másik fordítása. Az "alap" mező értékei a következők lehetnek:
- nulla: A mondat eredeti, nem egy másikon alapul.
- nagyobb, mint 0: A mondat azonosítója, amelyen alapul.
- \N: Ismeretlen (ritka).
- Mezők és formátum
- Mondat azonosítója (id) [tab] Alap mező
Mondatok (CC0)
- Fájlnév
-
Összes nyelv Csak a következő nyelvű mondatok: algériai arab Ancient Hebrew angol arab belarusz bengáli berber cseh dán eszperantó finn főniciai francia héber hindi Ho holland ido interlingua japán Jewish Babylonian Aramaic Jewish Palestinian Aramaic jiddis kabije kantoni karelai katalán kínai klasszikus kínai klingon középangol Kven Finnish láadan ladino latin lengyel ligur magyar marokkói tamazight német norvég (bokmål) Nyungar ófríz ógörög olasz Old Aramaic orosz óskandináv portugál spanyol svéd szantáli Sziloti nyelv Tachawit Toki Pona ukrán volapük walesi Ismeretlen nyelv - Fájl leírása
- Az összes CC0 alatt elérhető mondatot tartalmazza.
- Mezők és formátum
- Mondat azonosítója (id) [tab] Nyelv [tab] Szöveg [tab] Utolsó módosítás dátuma
Hivatkozások
- Fájlnév
- links.tar.bz2
- Fájl leírása
- A mondatok közötti linkeket (kapcsolatokat) tartalmazza. 1 [tab] 77 azt jelenti, hogy a 77. mondat az 1. mondat fordítása. A másik irányú link (kapcsolat) is jelen van, így a fájl tartalmaz egy olyan sort is, amely a következőt tartalmazza: 77 [tab] 1.
- Mezők és formátum
- Mondat azonosítója (id) [tab] Fordítás azonosító (id)
Címkék
- Fájlnév
- tags.tar.bz2
- Fájl leírása
- Az egyes mondatokhoz tartozó címkék listáját tartalmazza. 381279 [tab] proverb például azt jelenti, hogy a #381279 számú mondathoz a "proverb" címkét rendelték.
- Mezők és formátum
- Mondat azonosítója (id) [tab] Címke név
Listák
- Fájlnév
- user_lists.tar.bz2
- Fájl leírása
- Tartalmazza a mondatlisták listáját.
- Mezők és formátum
- Lista azonosító (id) [tab] Felhasználónév [tab] Létrehozás dátuma [tab] Utolsó módosítás dátuma [tab] Lista név [tab] Szerkesztheti
Mondatok listákban
- Fájlnév
- sentences_in_lists.tar.bz2
- Fájl leírása
- Jelzi azokat a mondatokat, amelyeket valamelyik lista tartalmazza. 13 [tab] 381279 például azt jelenti, hogy a #381279 számú mondatot a 13-as azonosítójú lista tartalmazza.
- Mezők és formátum
- Lista azonosító (id) [tab] Mondat azonosítója (id)
Japán indexek
- Fájlnév
- jpn_indices.tar.bz2
- Fájl leírása
- A Jim Breen által megosztott Tanaka Corpus fájl "B sorok" megfelelőjét tartalmazza. A formátumot lásd ezen az oldalon. Minden bejegyzéshez egy japán/angol mondatpár tartozik. Mondat azonosítója (id) a japán mondat azonosítójára utal, Jelentés azonosító (id) pedig az angol mondat azonosítójára.
- Mezők és formátum
- Mondat azonosítója (id) [tab] Jelentés azonosító (id) [tab] Szöveg
Mondatok hangfelvétellel
- Fájlnév
- sentences_with_audio.tar.bz2
- Fájl leírása
- Tartalmazza minden nyelvű mondat azonosítóit, amelyekhez hangfelvétel áll rendelkezésre. A többi mező tartalmazza, hogy ki rögzítette a felvételt, annak licencét és URL-jét a szerző hivatkozásához. Ha a licenc mező üres, akkor nem használhatod fel a hangfelvételt a Tatoeba projekten kívül.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Mezők és formátum
- Mondat azonosítója (id) [tab] Audio id [tab] Felhasználónév [tab] Licenc [tab] Forrásmegjelölési URL
A felhasználók nyelvtudás szintje
- Fájlnév
- user_languages.tar.bz2
- Fájl leírása
- Jelzi a tagok önbevalláson alapuló tudásszintjét az egyes nyelveken.
- Mezők és formátum
- Nyelv [tab] Tudásszint [tab] Felhasználónév [tab] Részletek
Felhasználók mondatellenőrzései
- Fájlnév
- users_sentences.csv
- Fájl leírása
- Felhasználók által ellenőrzött mondatokat tartalmaz. Az ellenőrzés értéke lehet -1 (a mondat nem megfelelő), 0 (nem eldöntött vagy kétes) vagy 1 (a mondat megfelelő). Figyelem: ezek az adatok még mindig kísérleti jellegűek.
- Mezők és formátum
- Felhasználónév [tab] Mondat azonosítója (id) [tab] Átnéz [tab] Hozzáadás dátuma [tab] Utolsó módosítás dátuma
Átiratok
- Fájlnév
-
Összes nyelv Csak a következő nyelvű mondatok: japán kantoni kínai üzbég - Fájl leírása
- Tartalmaz minden átiratot kiegészítő vagy alternatív írásrendszerben. Az átirathoz társított felhasználónév azt a felhasználót jelöli, aki utoljára ellenőrizte vagy esetleg módosította azt. A felhasználónév nélküli átiratok nincsenek ellenőrzöttként megjelölve. Az írásrendszer nevét az ISO 15924 szabvány határozza meg.
- Mezők és formátum
- Mondat azonosítója (id) [tab] Nyelv [tab] Írásrendszer [tab] Felhasználónév [tab] Átirat