INTERLNG Archives

Discussiones in Interlingua

INTERLNG@LISTSERV.ICORS.ORG

Options: Use Forum View

Use Monospaced Font
Show Text Part by Default
Show All Mail Headers

Message: [<< First] [< Prev] [Next >] [Last >>]
Topic: [<< First] [< Prev] [Next >] [Last >>]
Author: [<< First] [< Prev] [Next >] [Last >>]

Print Reply
Subject:
From:
Peter Kovacs <[log in to unmask]>
Reply To:
INTERLNG: Discussiones in Interlingua
Date:
Fri, 26 Nov 2004 05:01:11 -0500
Content-Type:
text/plain
Parts/Attachments:
text/plain (57 lines)
Io ha ancora questiones super le Wiktionario:

Que son su fontes? Io pote imaginar un dictionario enorme unificate
(multilingual), un _corpus_ de interlingua talmente (e io demanda al mesme
tempore: esque illos es realisate in Wiktionario):

- on presenta in illo le tote IED (e le CIED) in illo

- on presenta (omne le entratas in interlingua de) le dictionarios svedese
(de Boalt) e nederlandese (de Piet Cleij), como dictionarios
reguardate "plus standard" de interlingua - nam illos reflecte le uso
contemporanee, le uso "adequate" de interlingua (in contra de IED)

- on presenta tote le dictionarios national (opinate bon, perfecte a
representar le ia standard) - italian, portugese, germano, etc.


- on usarea medios de linguistica de corpus (corpuslinguistica? corpus-
linguistica?), e talmente modificar, o compler le corpus ja existente de
iste fontes

Io demanda alora: esque istos es realisate in Wiktionario? Esque
Wiktionario usa medios de corpuslinguistica?

Le medios de corpus-linguistica (que es exclusivemente computatorial) son:

- colliger textos in interlingua (si possibile le totes...isto debe esser
le scopo. Nonobstante quanto plus grande es le corpus, tanto plus ben il
es) a esser le corpus del dictionario(s) posterior (a facer)

- facer examines (recercas, etc.) del frequentia de parolas (isto es pro
exemplo: cercar super "estudiar" e "studiar"; "computador" e "computator"
in le corpus unificate, e vider, quanto sovente appare "estudiar"
e "computador" in le textos: si le formas "studiar" e "computator" ap
pare
multe plus sovente in le textos, que le altere formas, il essera clar, que
le formas plus rar es errores, respectivemente solmente exemplos del uso
individual...Le exemplos non es bon, io sape, proque nos omnes sape,
que "estudiar" e "computador" son errores in ia; io debeva solmente
modellar in alicun maniera...) O si le "quia" e "et" appare plus rarmente
in le corpus unificate de interlingua, que "proque" e "e", alora iste
ultimes debe esser apparer in le dictionario, como standard (le formas
archaic non, o con addition del explication, que illos es archaismos,
o "rarmente usate", etc.)

Le medios de linguistica de corpus es usate in nostre tempores como medios
exclusive (o principal) de facer dictionarios moderne e vermente
representative del uso contemporanee communal de ulle lingua.

Assi anque isto deberea esser usate (como le base) in le face
r de un
dictionario enorme unificate de interlingua. Le essential es qual es le
prender del exemplos, samplos (sampling in le anglese); isto non pote
esser ad hoc, accidental, ma debe haber un systema.

KOVÁCS Péter

ATOM RSS1 RSS2