Orde 10

Voor een aantal projectjes waar ik momenteel mee bezig ben liep ik er tegen aan dat mijn corpus van Nederlandse taal te klein is (ongeveer 1 miljard woorden). Het bleek moeilijk om zinnige dingen te zeggen over wat minder voorkomende woorden.

Recentelijk heb ik dus mijn best gedaan om een groter corpus te creëren, om een concreet doel te hebben heb ik besloten om een woordvierkant te zoeken van 10 x 10, de heilige graal in de lologica. Alle 10 letter woorden uit mijn huidige corpus kunnen samen niet zo’n vierkant vormen.

Engels

In het Engels zijn vele serieuze pogingen gedaan in de afgelopen 100 jaar, de meest succesvolle is van Rex Gooch in 2004 met 692847 woorden en maar liefst een jaar computatie. Dit woordvierkant gebruikt helaas 2 onzin dorpjes en een woord met een streepje (Een Turkse en een Guineese plaats beide van 100 inwoners), maar wordt wel gezien als oplossing. Dus we houden dat voorlopig aan als maatstaf voor een Nederlandse variant.

 d e s c e n d a n t
 e c h e n e i d a e
 s h o r t c o a t s
 c e r b e r u l u s
 e n t e r o m e r e
 n e c r o l a t e r
 d i o u m a b a n a
 a d a l e t a b a t
 n a t u r e n a m e
 t e s s e r a t e d

“Echeneidae” is met een hoofdletter, “Dioumabana” en “Adaletabat” zijn kleine dorpjes, en “nature-name” heeft een streepje.

Eerste poging

Ik heb eerst berekend hoeveel 10-letter woorden er nodig zijn om een redelijke kans op minstens één vierkant te hebben, dat zijn er ongeveer 250000. Toen ik 2.5 miljard woorden in m’n corpus had was ik op dit punt. De data is nu nog redelijk betrouwbaar: nieuwsartikelen, boeken, staatsdocumenten, rechtspraak (een miljard woorden!) woordenboeken, ondertiteling, een hoop grote Nederlandse websites en Wikipedia.

Helaas leverde dit nog geen fatsoenlijk vierkant op. Een serieuze poging dataverzameling later zat ik op 4.4 miljard woorden. Dit keer is er een heel hoop internettekst bijgekomen, simpelweg data verzameling van websites maar ook enkele fora. Hierin vinden we 400.000 verschillende 10 letter woorden die minstens 3 keer voorkomen. Daarmee maken we 65 vierkanten van lage kwaliteit, de beste is deze:

 e s c a p e g a m e
 s t o l o n i f e r
 c o l l e g e d a g
 a l l u d e r e n d
 p o e d e l e n d e
 e n g e l a n d e n
 g i e r e n m e r k
 a f d e n d e r d e
 m e a n d e r d e n
 e r g d e n k e n d

– R. stolonifer (zwarte broodschimmel)
– er zijn meerdere Nederlandse plaatsen genaamd Engeland.
– gierenmerk is een goedkoop merk
– ergdenkend is oud-Nederlands, in de klasse weldenkend en omdenkend.

Oplossing

Ideaal is het niet, en ook niet beter dan de Engelse variant. Dus ik heb nog een poging gedaan. 6 miljard woorden, waarvan 500.000 unieke 10 letter woorden met een frequentie van minimaal 3. De belangrijkste extra bronnen zijn de grote Nederlandse fora waarvan ik nu een volledige “back-up” heb, de kwaliteit van deze tekst is natuurlijk lager dus we moeten wat meer spitten. Hiermee vinden we na een week de computer te laten draaien 1040 vierkanten waarvan de beste:

 r a s k a k k e r s
 a n t a l i a n e n
 s t a m l e n g t e
 k a m e e l g e e l
 a l l e r d o l s t
 k i e l d i e p t e
 k a n g o e r o e s
 e n g e l p o o r t
 r e t e s t e r k e
 s n e l t e s t e n

Antalianen zijn mensen uit Antalya (Turkse toeristenstad met 2.2M inwoners). De rest van de woorden spreekt voor zichzelf, geen slecht resultaat! Met als enige schoonheidsfout een hoofdletter vermoed ik dat er niet een veel betere oplossing is. In de toekomst ga ik wat interessantere projectjes doen met dit nieuwe corpus, maar dit was in ieder geval een leuke motivatie om hem samen te stellen.

Wilhelmus deel 2

Toen ik mijn vorige post over Het Wilhelmus in Canon schreef had ik beloofd ook nog canons te schrijven die niet alleen het Wilhelmus gebruiken. Specifiek heb ik het dan over dubbel canons, waarbij je 2 canon schrijft de je simultaan kan spelen. Hierbij dus een extra set canons die je tegelijk kan spelen met de canons op het het Wilhelmus die ik al heb gedeeld. Ik heb de canons die alleen alleen het Wilhelmus bevatten hier weg gelaten, maar hier kun je de volledige set vinden.

Motivatie

De gedachte achter deze set is muzikaal. Daarnaast is het een fijn om een sterkere intuïtie op te bouwen wat betreft canonisch schrijven. Er volgt namenlijk nog een set canons die de vorm tot in het onnodig moeilijke doorwerkt, en waarin de muzikaliteit is gereduceert tot een formaliteit waaraan voldaan moet worden. Maar daarvoor moest ik eerst comfortabeler zijn met de vorm.

Canons

Ik heb bij alle canons naast een audiofragment van het geheel ook audiofragmenten gemaakt waarbij 1 stem 50% luider is dan de rest van de stemmen, bij een aantal canons kan dit het geheel in nieuw perspectief zetten.

Voor de duidelijkheid nog één maal het thema, het eerste deel van het Wilhelmus.
Wilhelmus

In de eerste canon heeft de onderste stem (stem 3) het Wilhelmus terwijl de 2de stem hetzelfde is als de eerste maar achterwaarts gespeeld.
Wilhelmus

Stem 1, eigen melodie:
Stem 2, stem 1 achteruit:
Stem 3 , Wilhelmus:
Geheel:

In de tweede canon zie je het Wilhelmus terug in stem 2 & 4 en een chromatisch thema (veel tonen buiten de toonladder) in stem 1 & 3.

03-Wilhelmus

Stem 1, eigen melodie:
Stem 2, Wilhelmus:
Stem 3, stem 1, lager:
Stem 4, Wilhelmus:
Geheel:

Voor de verandering een andere toonsoort:
Wilhelmus

Stem 1, eigen melodie:
Stem 2, eigen melodie:
Stem 3, Wilhelmus:
Stem 4, Wilhelmus:
Geheel:

Stem 1 & 2 spelen het Wilhelmus in canon na één tel. Stem 4 is stem 3 na 6 tellen en in omkering.
Wilhelmus

Stem 1, Wilhemus:
Stem 2, Wilhelmus:
Stem 3, eigen melodie:
Stem 4, stem 3 in omkering:
Geheel:

De eerste 6 stemmige, de niet Wilhelmus canon vind je in stem 3,4 en 6 waarbij stem 3 op half tempo in omkering speelt.
Wilhelmus

Stem 1, Wilhelmus:
Stem 2, Wilhelmus:
Stem 3, stem 6 half zo snel/op de kop:
Stem 4, stem 6:
Stem 5, Wilhelmus:
Stem 6, eigen melodie:
Geheel:

Een beetje avontuurlijke canon met het Wilhelmus als begeleiding
Wilhelmus

Stem 1, Wilhelmus omkering:
Stem 2, eigen melodie:
Stem 3, stem 2 lager:
Geheel:

De tweede 6 stemmige en enige driedubbele canon in omkering, dat wil zeggen dat deze canon bestaat uit 3 2-stemmige canons in omkering.
Wilhelmus

Stem 1, eigen melodie I:
Stem 2, eigen melodie II:
Stem 3, Wilhelmus in omkering:
Stem 4, eigen melodie II in omkering:
Stem 5, Wilhelmus in omkering:
Stem 6, eigen melodie I in omkering:
Geheel:

Na de lange intro in stem 2 komt stem 3 binnen als een letterlijke imitatie daarop en stem 1 op dubbel tempo.
Wilhelmus

Stem 1, stem 2 dubbel zo snel:
Stem 2, eigen melodie:
Stem 3, stem 2:
Stem 4, Wilhelmus half zo snel:
Geheel:

Stem 1 herhaalt zichzelf een keer maar dan een stukje hoger, dit zorgt ervoor dat dit geheel past boven zichzelf in half tempo in stem 3.
Wilhelmus

Stem 1, eigen melodie:
Stem 2, Wilhelmus:
Stem 3, stem 1 langzamer:
Stem 4, Wilhelmus langzamer:
Geheel:

Perfect fourth

This is a second spin off of the future post “A search for interesting canons part 2” (part 1), (previous spin off) . Like the previous one this post is probably not interesting to you if you’re not into musical theory, but I’ll try to avoid jargon.  When searching for the best melody in canon it is necessary to define the rules of counterpoint, and for the most part I follow common practice rules. I do have 2 personal exceptions that I would like to document real quick, the first one is about the dissonance of the fourth.

Recap

In general 2 frequencies that share more harmonics (and conversely have a simpler ratio) sound better to the human ear. And the ideas of counterpoint adopt this with one exception: the perfect fourth. While in the case of the second and third their inverse frequency ratios (respectively the seventh and sixth) are treated the same, the perfect fourth is not treated identically to its inverse the perfect fifth. Specifically, it is treated as a dissonance when the interval occurs between the bass and another voice.

Reason for dissonance

The given reason for this is that with the interval of the fourth you can only deduce one consonant chord, with the top note of the interval as its root. Generally people prefer to hear the bottom note as the root. When you build a chord from the bottom note, the fourth is a dissonant note within that chord. The question is of whether the fourth is consonant is equivalent to asking whether you think you’re listening to one chord or another.

There might be a larger harmonic context that biases your interpretation of the chord. But at its basis you want to listen to whether you want the “fourth” to move downward to resolve an audible dissonance. Note that all of these are dissonant when following common practice counterpoint rules.
chords.png
The red ones have tension to my ear, the black ones sound consonant like F-major chords to me.

Conclusion

So rather than classify all perfect fourths as dissonant and disqualifying them, here are my two personal exceptions: The interval of an octave and a fourth can not be bare.
And: Any chord in the second inversion must be harmonically as sensible as the same chord interpreted as a root chord.

The bare octave+fourths sounding dissonant also makes sense considering the sparse overlap in their harmonic series compared to octave+third or octave+fifth.

Retrograde

My post “A search for interesting canons part 2” (part 1) is getting longer and longer so I decided to spin off a couple of minor parts into separate posts to keep everything manageable. This post is probably not interesting to you if you’re not into musical theory.

Traditional

Retrograde refers to playing music backwards. For at least 500 years (without exception as far as I know except the literal signal reversal that exists in electronic music), this is done as such:visual.png

These 3 examples show some of the most basic movements, a rising figure, a back and forth figure and a cross figure. You can see how the rising figure in ex.1 become a back and forth figure. And the back and forth figure becomes a falling figure in ex.2. And how the cross figure in ex.3 is broken in two separate pieces.

These motive-breaking transformations are considered a fact of life when playing something in retrograde and they are generally the basis of much critism against retrograde (it being just a intellectual visual trick) It is probably also an important contributor to the rarity of retrograde as a contrapuntal device (compared to inversion or augmention) as it is hard to write melodies that sound good in retrograde, especially in counterpoint.

Audible

So I want to propose a more audible retrograde, the main problem with the visual retrograde is that the note durations are wrong, when looking at a theme played backwards and looking at the space between adjacent notes it becomes intuitively obvious that you should use the time value of the next note as duration for the current:
retrograde_explanation

This creates a retrograde much closer to an actual sound-retrograde. The duration of the first note can be anything when it’s the actual last note to be played. When the reversed music is repeated you simply use the time value of the first(retrograde first) duration.

The audible retrograde of the example motives is written as such:

visual_retrograde

While it does not look as striking it does retain all the basic motives. Making it easier on the ear, easier to hear as a transformation and easier to write for. And so it’s the retrograde that I will focus on in my future posts.

Tekenend gedichtje

Elke dinsdag geef ik een dagje les op DOE en er werd mij gevraagd om iets over mijzelf te schrijven voor op de website. Het leek me leuk om wat informatie te verstoppen in dit verhaal, als een puzzel. Helaas is het een beetje uit de hand gelopen… Ik heb er in ieder geval wel een blogpost aan over gehouden.

Inspiratie

Met als inspiratie mijn vorige post over priemgetallen en een tekenalgoritme leek het mij in eerste instantie leuk om een gedicht te hebben waarbij de lengtes van de woorden je vertellen hoe je iets moet tekenen voor dat algoritme. Het tekenalgoritme uit de vorige post bleek echter zeer onhandig (ook om uit te leggen in het gedicht zelf). Dus heb ik voor een simpele methode gekozen, oneven woordlengtes zijn een zwart vakje, even woordlengtes een wit vakje. Het plaatje moet natuurlijk dit worden:

doe.png

Als we het zo tekenen hebben we 65 woorden nodig. Het leuke hieraan is dat DOE een afkorting is van een veel langer woord. De som van alle letters (a=1, b=2, etc) van democratisch onderwijs eindhoven is 331. Dit is leuk, niet alleen omdat dit een priemgetal is maar ook omdat 331 / 65 woorden ≃ 5, het gemiddelde aantal letters per woord in de Nederlandse taal. Met andere woorden: Het is mogelijk een gedicht te maken dat het bovenstaande plaatje representeert met een woord per vakje. En het is mogelijk om dat gedicht evenveel letters als de letterwaarde van zijn tekening te geven.

Toen ik daarna ook nog zag dat mijn volledige naam de letterwaarde 113 had – ook een priemgetal. En dat 331 letters / 113 ≃ 3, de precieze verhouding van lettergrepen tot letters. Toen heb ik toch maar een poging gedaan tot een gedichtje.

Gedicht

Neem zodra wat blaadjes (hokjes).
Dertien bij zeg vijf creëren.
Ieder woord hier nu gekozen.
Er mee slim dan associëren.

Woorden lengte net oneven?
Zijn de zwarte polygonen.
Schrijft uit ja dit mooi ontworpen.
Maak een som die past patronen:

A is één, en Z zestwintig,
hoe is dan geteld gevallen?
Neem mijn letters tel geschreven:
vind gelijke priemgetallen!

(Ook lettergrepenaantal nog
naamsommering overigens.)

Verklaring

Hokjes
Neem zodra wat blaadjes (hokjes).
Dertien bij zeg vijf creëren.

Woorden associëren
Ieder woord hier nu gekozen.
Er mee slim dan associëren.

Elk woord heeft een vakje, de simpelste manier is om ze op volgorde in te vullen:

Neem zodra wat blaadjes hokjes Dertien bij zeg vijf creëren Ieder woord hier
nu gekozen Er mee slim dan associëren Woorden lengte net oneven Zijn de
zwarte polygonen Schrijft uit ja dit mooi ontworpen Maak een som die past
patronen A is één en Z zestwintig hoe is dan geteld gevallen Neem
mijn letters tel geschreven vind gelijke priemgetallen Ook lettergrepenaantal nog naamsommering overigens

Oneven woordlengtes
Woorden lengte net oneven?
Zijn de zwarte polygonen.

Een polygon omvat alle veelhoeken, zo ook de hokjes. Elk hokje dat een oneven woordlengte bevat kleuren we zwart, de rest laten we wit.

X X X X X X X X
X X X X X
X X X X X X X
X X X X X
X X X X X X X X

Uitschrijven
Schrijft uit ja dit mooi ontworpen.
Maak een som die past patronen.

DOE staat voor Democratisch onderwijs Eindhoven. Hoe we hier een som van moeten maken is nog niet duidelijk.
Sommeren
A is één, en Z zestwintig,
hoe is dan geteld gevallen?

Democratisch Onderwijs Eindhoven is volgens deze telling gelijk aan 331.

D e m o c r a t i s c h O n d e r w i j s E i n d h o v e n
4 5 13 15 3 18 1 20 9 19 3 8 15 14 4 5 18 23 9 10 19 5 9 14 4 8 15 22 5 14

Neem mijn letters tel geschreven:
vind gelijke priemgetallen!

Het aantal letters in het gedicht is óók precies 331.

Naamsommering
(Ook lettergrepenaantal nog
naamsommering overigens.)

Met dezelfde methodiek als hierboven is “Bob Lucassen” 113, ook een priemgetal en het aantal lettergrepen in het gedicht. Bij wijze van creatieve signatuur.

Priemgetal visualisatie

Een korte post om de stilte te doorbreken!

Handwerk

Even geleden had ik geen laptop tot mijn beschikking, alleen Duplo. Ik ben toen een trap gaan maken die een bocht naar rechts maakt voor elke tree die een priemgetal is. Uiteindelijk ben ik tot 103 treden gekomen met nog een paar blokjes over. Zie hier het resultaat, met rechts een wat duidelijker voorbeeld van wat de bedoeling is:blokjes.jpg
Dit is wat ik mensen laat zien als ze vragen of ik ook wel eens niet achter de computer zit.

De uitdaging was om zo min mogelijk draagconstructie te hebben, zonde van je materiaal! Het is dus belangrijk om vanaf het begin te weten hoe de trap zich beweegt. Daarvoor moet je een soort bovenaanzicht maken van de hoekpunten van de trap:

De priemgetallen <= 100: 2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59,61,67,71,73,79,83,89,97
first100primes_arrows.png
Een wit vakje is meerdere keren betreden

Rekenwerk

De trap heeft ongeveer 5 minuten gestaan voor hij spontaan omviel, maar dat diagram heeft later nog mijn nieuwsgierigheid gewekt. Dit is een video van het tekenen van dit diagram voor de eerste biljoen (10¹²) treden, in de laatste paar seconde wordt de helft van de treden gezet (500 miljard) door de steeds verregaande versnelling:

 

Je kunt behalve priemgetallen ook andere lijsten nummers in deze fictieve tekenaar stoppen, waarbij wederom de nummers in de reeks bepalen welke treden hoekpunten zijn. Veel reeksen, zoals de kwadraten (1,4,9,16,..), Pascals driehoek, Catalaanse nummers, Douglas Hofstadter’s zelf refererende reeksen, en nog veel meer voorbeelden maken simpelweg 4 diagonale lijnen, wat in trapvorm een soort omgekeerde piramide zou worden. Dit gebeurt omdat het geometrische of bijna geometrische reeksen zijn, niet zo interessant dus. Maar functies met niet steeds hoger wordende waardes kunnen verrassende effecten hebben, zoals Mertens’ functie (eerste 10⁶ waarden), die moderne kunst produceert:

frame_00744

Eigen reeks

Als je de verschillen tussen de nummers in een reeks pakt:
2,3,5,7,11,13 wordt dan 2-0, 3-2, 5-3, 7-5, 11-7, 13 – 11.
Dan is de hoeveel stappen tussen 2 draaien naar rechts gelijk aan deze verschillen. Het is dan ook mogelijk om een verschil van 0 te hebben, waardoor je op je plek naar rechts draait. Je kan nu elke vorm tekenen die verbindbaar is met een rechte lijn, een rechte lijn maken werkt dan zo (in verschillen opgegeven):
1,0,0,0,1,0,0,0,1,0,0,0,1,..
We lopen 1 stap in de huidige richting, draaien naar rechts, draaien nogmaals 3 keer naaar rechts en lopen weer 1 stap.

Je kunt zo voor bijvoorbeeld elk cijfer een plaatje maken, en met een beetje puzzelen kun je elk cijfer ook dezelfde hoeveelheid stappen in laten ne nemen door waar nodig een rondje op de wplek te draaien.

Wat nu leuk zou zijn is om een reeks te maken die cijfers tekent, en dan het liefst de cijfers van die reeks zelf:test.png
De eerste 50 waarden zijn : 0,0,0,0,1,0,0,2,1,1,2,1,2,2,2,4,0,0,0,0,1,0,0,2,1,
1,2,1,2,2,2,4,0,0,0,0,1,0,0,2,1,1,2,1,2,2,2,4,0,0,0,0,1,0,0,2,1,1,2,1,2,
2,2,4,0,0,0,0,1,0,0,0,0,0,1,0,2,0,2,4,0,0, etc.
Dit is het bovenaanzicht na een paar 100 stappen:
frame_00080De onhandige grote constante waarmee deze formule begint bevat de informatie voor het tekenen van de cijfers.

De ongedocumenteerde code voor het genereren van deze plaatjes staat op github. Als er nog suggesties zijn wat betreft reeksen om te tekenen hoor ik het graag.

 

Woordmachientje

Iedereen heeft als kind wel eens een rekenmachine op de kop gehouden en opgemerkt dat de cijfers letters kunnen voorstellen. Meestal deze:

mapping.png
In deze post mag het cijfer ‘0’ ook een D voorstellen. D, O, I, Z, E, S, L worden in het vervolg als d, o, i, z, e, s, l geschreven om alles wat makkelijker leesbaar te maken (heleboel in plaats van hELEbOEL).

Langste woorden

Je kan dan leuke woorden spellen zoals lol (707) of heleboel (73083734). Ongeveer 0.5% van alle woorden kunnen worden getypt op een rekenmachine. Uit het Groene Boekje (100.000 woorden) zijn het er bijvoorbeeld 447. Het langste woord dat geschreven kan worden op de rekenmachine is niet biologieles zoals vaak wordt beweerd, of zelfs gezelligheid (mag gezelligheidsgedoe?) maar geldigheidsgebied. Wellicht vind je geldigheidsgebied een beetje gek en hobbeldebobbel valsspelen maar bloedeloosheid en ideologieloos zijn toch zeker een verbetering, voor de 12 cijferige calculator althans.

Sommen

Wat natuurlijk echt leuk is zijn de sommen die je kan maken, waarbij een optelsom van 2 woorden een nieuw woord oplevert. Een bekende variant van zo’n sommetje is lol+lol = hihi, want 707+707 = 1414. In de Opperlandse taal- & letterkunde van Battus (Hugo Brandt Corstius) wordt dit fenomeen ook al onderzocht, maar hier worden slechts enkele betekenisloze sommetjes gegeven. Dat kan beter! Van de vorm woord+woord=woord zijn in het Groene Boekje 554 oplossingen. De oplossing met de langste woorden is doezelig+bosgod = bobbelig. Maar ja, probeer daar maar eens een verhaal bij te verzinnen.

Sommige zijn wel heel logisch:
leeggebloede = doodgebloede + leeg
gegooide + ooi = gelooide

Maar deze zijn toch aardig:
goddeloos + del = geldeloos
gebelgde + edels = bezielde
godloos + goedig = zieligs

Deze 554 oplossingen waren nog wel met de hand te beoordelen, maar we kunnen maar liefst 33 duizend oplossingen vinden van de vorm woord+woord+woord = woord, zoals:
god + god + doelloos = zielloos
deels + dode + bob = bezig
zozo + dosis + lesbo = bezig

gebied + heil + god = globe
deze + olie + gel = geil
doodgoed + deze + god = gezegde
ziezo + deze + les = blog

Een greep uit andere soorten sommen:
doezel = ezel * ooi
doezelig = (doddig+ezel) * ooi
zeebioloog = bioloog*dooi + zee
zielloos = zieligheid + heilloos – heiligheid

Hoe langer de sommen hoe meer je kan zeggen, zoals deze aardige kritiek:
Bobs+blog+idee + die+zooi+geheid = gedoe

Want dat is het zeker! Al deze betekenis betekent vooral dat er te veel oplossingen zijn. Meer regels maken dus! Hier een woordvierkant met calculatorwoorden, die ook nog eens optelbaar zijn:
h o e +
o d e +
e e d = leg

Er is nog veel meer mogelijk, maar dat laat ik over als een opdracht aan de lezer.