Malayalam Sandhi

What is sandhi? A dictionary definition would say something like “the euphonic combination of sounds to facilitate pronunciation, often also represented in writing.” Sandhi in Sanskrit means “joining” and it refers technically to different ways that words are joined together both when speaking and when writing. Making words easier to pronounce in speech happens everywhere and all the time. Consider the English phrase, “what do you” In some places, it might be said, “whaccha”; in others, “whadya”; and so on. Or, “I am going to” becomes “Imma go ta”; “Let me” becomes “Lemme”; etc. Clearly articulating or distinguishing each word is often inconvenient and the sounds are regularly assimilated in one way or another. When authors try to replicate dialect or speech in English, they often turn to sandhi to capture some of the spoken effect. Sandhi means standardizing these pronunciation changes also in writing.

Many Indian languages employ sandhi in this more formal way, devising rules for how to combine sounds within and between words to replicate how they are or should be spoken. Malayalam is one such language and there are many possible sandhi combinations that learners of the language must know in order to read original Malayalam writing. In short, the common use of sandhi when speaking is carried over and formalized also in writing. This guide explains the basic rules of sandhi in Malayalam, and assumes familiarity with the Malayalam script throughout.

Here is a short list of the most frequent sandhi changes that you will need to know. 

  1. Final echo vowel ് drops before vowels and turn into ഉ before consonants.
  2. യ് and വ് are frequently used to join two vowels that come together.
  3. Doubled letters occur in compound words to keep the pronunciation of many words the same.
  4. Words that end in ം (അം) change to ത്ത് before most grammatical endings, except ഉം which becomes വും.

To get a better sense, let’s break these four rules down a bit more with some examples. According to the Keraḷapāṇinīyaṃ (1896), the well-known grammar by A.R. Rājarājavarma, there are four types of sandhi in Malayalam:

  1. a letter is lost or dropped (ലോപ)
  2. a letter is added (ആഗമ)
  3. a letter is doubled (ദ്വിത്വ)
  4. a letter is substituted or transformed (ആദേശ)

We will consider each type in order, using or following many of Rājarājavarma’s examples, though I have simplified the rules and patterns somewhat and focused on the most common sandhi forms. The rules may be helpful to readers who are used to grammatical terms, but most readers will find the patterns in the examples easier to use. 

1. The echo vowel ( ്) at the end of a word drops before a vowel. This is especially common before verbal negations and emphatic forms.

തണുപ്പ് + ഉണ്ട് = തണുപ്പുണ്ട്
കാറ്റ് + അടിക്കുന്നു = കാറ്റടിക്കുന്നു
അത് + അല്ല = അതല്ല
എന്ത് + ആണ് = എന്താണ്

2. The ഉ vowel that ends many verbs drops before common negations and emphatic forms that begin with a vowel and optionally with particles that begin with a vowel.

കണ്ടു + ഇല്ല = കണ്ടില്ല
ചെയ്തു + ഇല്ല = ചെയ്തില്ല
കാണുന്നു + ഉണ്ട് = കാണുന്നുണ്ട്
പോകുന്നു + ഉണ്ട് =പോകുന്നുണ്ട്
കണ്ടു + ഓ = കണ്ടോ or കണ്ടുവോ (optional)

3. Common words often drop a final vowel before an initial vowel. അല്ല and ഇല്ല drop the final a-sound; ആയി and പോയി drop the final ഇ-sound; negative participles ending in ആതെ drop the final എ-sound.

അല്ല + എന്ന് = അല്ലെന്ന്
ഇല്ല + ആയിരുന്നു = ഇല്ലായിരുന്നു
പോയി+ എന്ന് = പോയെന്ന്
ആയി + ഇല്ല = ആയില്ല
മിണ്ടാതെ + ഇരിക്ക് = മിണ്ടാതിരിക്ക്

4. After vowels pronounced toward the front of the mouth (അ ആ ഇ ഈ എ ഏ ഐ), യ് is added before a following initial vowel. 

കര + ഉള്ള = കരയുള്ള
പറ്റി + ഇല്ല = പറ്റിയില്ല
കൈ + ഉണ്ട് = കൈയുണ്ട്
എന്നെ + അറിയിച്ചു = എന്നെയറിയിച്ചു

5. After final vowels pronounced in the back of the mouth (ഉ ഊ ഒ ഓ ഔ), വ് is added before a following initial vowel. [Note: അ ആ are occasionally back vowels by position, i.e. by the letter that precedes them.]

തിരു + ഓണം = തിരുവോണം
എടുക്കുന്നു + എങ്കിൽ = എടുക്കുന്നുവെങ്കിൽ (or എടുക്കുന്നെങ്കിൽ)
പൂ + എന്ന് = പൂവെന്ന്
അ + ഇടം = അവിടം 

6. When the hard (unvoiced) pronunciation of the initial letters ക് ച് ത് and പ് would be softened in a compound noun or verb, the letter will double. Doubling preserves the sharper sound that would normally occur in initial position. This doubling occurs after vowels (except echo-vowel) and words that end in consonants.

പൊട്ടി + ചിരിച്ചു = പൊട്ടിച്ചിരിച്ചു
തല + കെട്ട് = തലക്കെട്ട്
കൈ + തൊഴിൽ = കൈത്തൊഴിൽ
ആൾ + കൂട്ടം + ആൾക്കൂട്ടം
അ + കാലം = അക്കാലം 

7. One-syllable words that end in a consonant double before endings that begin with a vowel.

മൺ (മണ്ണ്) + ഇൽ = മണ്ണിൽ
കൺ (കണ്ണ്)  + ഇന് = കണ്ണിന്
പെൺ + ഇന്റെ = പെണ്ണിന്റെ
തൻ + ഇൽ = തന്നിൽ 

8. The echo vowel becomes ഉ before a consonant in a compound or common phrase.

അത് + കൊണ്ട് = അതുകൊണ്ട്
വായിച്ച് + കഴിഞ്ഞു = വായിച്ചുകഴിഞ്ഞു

9. When the past-tense marker തു is added to a verb root that ends in a consonant, one or both consonants will change or assimilate.

കേൾ (കേൾക്കുക) + തു = കേട്ടു
വിൽ (വിൽക്കുക) + തു = വിറ്റു
കൊൽ (കൊല്ലുക) + തു = കൊന്നു 

10. Words that end in അം add ഉം by changing to വും.

പണം + ഉം = പണവും
അദ്ദേഹം + ഉം = അദ്ദേഹവും
വസ്ത്രം + ഉം = വസ്ത്രവും 

11. Words that end in – ം/ അം add other endings beginning with a vowel by changing to ത്ത്.

പണം + ഇന്റെ = പണത്തിന്റെ
അദ്ദേഹം + ഇന് = അദ്ദേഹത്തിന്
വസ്ത്രം + ഇൽ = വസ്ത്രത്തിൽ
ദൈവം + ഓട് = ദൈവത്തോട്
കഷ്ടം + എ = കഷ്ടത്തെ

1. in compound verbs or nouns

വെള്ളം കൊണ്ടുപോയിക്കൊള്ളൂ. (not വെള്ളം കൊണ്ട് പോയി കൊള്ളൂ.)
അംഗീകരിക്കുക + ഉണ്ടായിട്ട് + ഉണ്ട് → അംഗീകരിക്കുകയുണ്ടായിട്ടുണ്ട്

2. in clauses or phrases that convey a single idea

ധൃതിപിടിച്ച് ടാക്സിസ്റ്റാന്ഡിലേക്ക് നടുന്നു. (not ധൃതി പിടിച്ച്…)
എനിക്ക് + അനുകമ്പ + ആണ് + ഉള്ളത് → എനിക്കനുകമ്പയാണുള്ളത്.

3. in idiomatic phrases and with common words

ഞാനവിടെയിരുന്നു (not ഞാൻ അവിടെ ഇരുന്നു.)
അതുകൊണ്ടാണെന്ന്. (not അത് കൊണ്ട് ആണ് എന്ന്.)

4. when adding grammatical endings

പട്ടി + എ = പട്ടിയെ
കൈ + ഇൽ = കൈയ്യിൽ (കൈ → കൈയ് + യ് +ഇൽ)
അമ്മ + ഉടെ = അമ്മയുടെ

The last context is internal sandhi (within one word). External sandhi (between words) is trickier because some sentences or clauses can at first look like one big string of letters. In general, if you encounter a “word” that looks too long, it is probably several words joined by sandhi. The patterns and contexts above should help you identify the individual words after “breaking” the sandhi. Here are some examples of long phrases:

ചെയ്യാൻ ആവശ്യം പെടുക ആണ് → ചെയ്യാനാവശ്യപ്പെടുകയാണ്
രാഷ്ട്രങ്ങൾക്ക് എതിർ ആയി ആണ് → രാഷ്ട്രങ്ങൾക്കെതിരായിയാണ് 

Works Consulted

Rājarājavarma, A.R. 1896 [1996]. Keraḷapāṇinīyaṃ. ed. Scaria Zacharia. Kottayam: DC Books.
Gamliel, Ophira. 2020. A Linguistic Survey of the Malayalam Language in Its Own Terms. Wiesbaden: Harrassowitz.