Πνευμα, η λεξη "αυτοκινητο" ειναι παραδειγμα οτι η Ελληνικη γλωσσα εχει μερικες συνθετες λεξεις απο πρωτογενεις ριζες, αλλα αυτο δεν ειναι "μαθηματική δομή". Σιγουρα δεν ειναι ολες οι λεξεις συνθετες, και σιγουρα η Ελληνικη δεν ειναι η μονη γλωσσα με συνθετες λεξεις. Αυτη η παρεξηγηση φανταζομαι προερχεται απο επιλεκτικη συγκριση Ελληνικων συνθετων λεξεων με Αγγλικες πρωτογενείς λεξεις.
Οπως ενας parser υπολογιστη θα μπορουσε να καταλαβει (η μάλλον "αναλύσει") τη λεξη αυτο-κινητο, ετσι θα μπορουσε να αναλυσει και τη λεξη auto-mobile (στην πραγματικοτητα το αυτοκινητο ειναι απευθειας μεταφραση ή calque του automobile μιας και δεν ειναι Ελληνικη εφευρεση). Αλλο calque ειναι η λεξη ουρανο-ξύστης που ειναι απευθειας μεταφραση του sky-scrapper. Οποτε και οι δυο γλωσσες εχουν μαθηματικη δομη!
Το ιδιο ισχυει για συνθετες λεξεις οποιασδηποτε γλωσσας που δεν υπαρχουν στα Ελληνικά, οπως πχ το Γερμανικο ρημα ϋber-reden που σημαίνει "πείθω". Εδω ο parser θα μπορουσε να αναλυσει τη Γερμανικη καλυτερα απο την Ελληνικη λέξη "πείθω" που είναι πρωτογενής. Αυτό σημαίνει οτι τα Γερμανικά έχουν μαθηματική δομή;
Μια αλλη παρεξηγηση, πολυ σολιψιστική και προπαγανδιστική κατα τη γνωμη μου, ειναι αυτο που αναφερεις πιο πανω, οτι οι ξενες γλωσσες δημιουργηθηκαν "απο πεντε ανθρωπους σε ενα δωματιο διχως λογο και αιτια". Αυτο ειναι πολυ υποτιμητικο για την ιστορια των γλωσσων και προφανως ξεκιναει απο ατομα που δεν εχουν ιδεα για αλλες γλωσσες και ετυμολογία.
Το car δεν ειναι ξεκαρφωτη λεξη, αλλα η μορφη μιας λεξης οπως εξελιχτηκε στην παροδο του χρονου απο τα Λατινικα και τα Κελτικα (αυτο που εμεις αποκαλλούμε κάρρο). Η διαφορα του καρρου απο το αυτοκινητο, ειναι απλα οτι η πρωτη ειναι πρωτογενης, και η δευτερη συνθετη, αλλα αυτο δε λεει τιποτα για τη μαθηματικη δομη, και καλλιστα θα μπορουσε να ισχυει το αντιθετο σε αλλα ζευγη ελληνικων και αγγλικων λεξεων.
Η λεξη sherrif (σερίφης) σου φαινεται μια τυχαια, στειρα λεξη. Στην πραγματικοτητα ομως σημαινει "επαρχιοφυλακας" μιας και αποτελειται απο τις λεξεις shire-reeve (Παλαιοαγγλικα: sciregerefa)
Και τελος, οπως περιγραφω στις τελευταιες αναρτησεις, υπαρχουν οι συγκολλητικές γλώσσες οι οποίες φαινομενικά αναλύονται πολύ πιο ομαλά και εύκολα απο τους υπολογιστές. Τετοιες ειναι τα Σουμεριακα, τα Τουρκικα και η Κετσουα (Περουβιανά).
Αλλα η πραγματικοτητα ποια ειναι; Οι γλωσσες γενικοτερα κωδικοποιουν τις ιδιες πληροφοριες, απλως με αλλο τροπο. Με τους καταλληλους αλγοριθμους προσαροσμενους σε καθε γλωσσα, ενας υπολογιστης θα μπορουσε να αναλυσει λεξεις οποιασδηποτε γλωσσας.