Skip to content

TTS: Sifferinterval bør lesast som "frå X til Y" #31

@snomos

Description

@snomos

For tekst som denne:

Muhtem suohkanijn li badjel 10 % viesádijn álldarin 40-79 jage diabiehtta sládja 2.

bør 40-79 lesast som frå X til Y, dvs med rett kasus på dei to tala. Slik det er no blir tala gjort om til X strek Y, som er forståeleg men veldig merkeleg. Her er noverande normalisering (med analyse):

: 
"<álldarin>"
	"áldar" N Sem/Feat-phys Ess "álldar>X5in"MIDTAPE <W:0.0> @<SPRED #8->3
	"áldar" N Sem/Feat-phys Sg Ine "álldar>X5in"MIDTAPE <W:0.0> @<ADVL #8->3
: 
"<40-79>"
	"nielljalåk tjanássáhtso gietjavlåkaktse" Num Arab Sg Gen "40∑-79>"MIDTAPE <W:0.0> @>N #9->15 "nielljalåk tjanássáhtso gietjavlåkaktse"phon
		"40-79" Num Arab Sg Gen "40∑-79>"MIDTAPE <W:0.0> @>N #9->15
	"nielljalåk tjanássáhtso gietjavlåkaktse" Num Arab Sg Nom "40∑-79>"MIDTAPE <W:0.0> @SUBJ> #9->15 "nielljalåk tjanássáhtso gietjavlåkaktse"phon
		"40-79" Num Arab Sg Nom "40∑-79>"MIDTAPE <W:0.0> @SUBJ> #9->15
: 
"<jage>"
	"jahke" N Sem/Time Sg Gen "jahke>Q1"MIDTAPE <W:0.0> @Num< #10->10
: 

Eg føreslår at vi heller deler opp denne teksten i tre segment, omtrent slik:

"<40>"
	"40" A Arab Ord Attr CLBfinal "40"MIDTAPE <W:0.0>
	"40" Num Arab Err/Orth Ess "40>"MIDTAPE <W:0.0>
	"40" Num Arab Err/Orth Sg Acc "40>"MIDTAPE <W:0.0>
	"40" Num Arab Err/Orth Sg Com "40>"MIDTAPE <W:0.0>
	"40" Num Arab Sg Ela Attr "40"MIDTAPE <W:0.0>
	"40" Num Arab Sg Gen "40>"MIDTAPE <W:0.0>
	"40" Num Arab Sg Ill Attr "40"MIDTAPE <W:0.0>
	"40" Num Arab Sg Ine Attr "40"MIDTAPE <W:0.0>
	"40" Num Arab Sg Nom "40>"MIDTAPE <W:0.0>
	"40" Num Sem/ID "40"MIDTAPE <W:0.0>
"<->"
	"-" PUNCT "∑-"MIDTAPE <W:0.0>
"<79>"
	"79" A Arab Ord Attr CLBfinal "79"MIDTAPE <W:0.0>
	"79" Num Arab Err/Orth Ess "79>"MIDTAPE <W:0.0>
	"79" Num Arab Err/Orth Sg Acc "79>"MIDTAPE <W:0.0>
	"79" Num Arab Err/Orth Sg Com "79>"MIDTAPE <W:0.0>
	"79" Num Arab Sg Ela Attr "79"MIDTAPE <W:0.0>
	"79" Num Arab Sg Gen "79>"MIDTAPE <W:0.0>
	"79" Num Arab Sg Ill Attr "79"MIDTAPE <W:0.0>
	"79" Num Arab Sg Ine Attr "79"MIDTAPE <W:0.0>
	"79" Num Arab Sg Nom "79>"MIDTAPE <W:0.0>
	"79" Num Sem/ID "79"MIDTAPE <W:0.0>
:\n

og at vi med utgangspunkt i bindestreken mellom to tal (og ev konteksten før og etter tala) vel dei kasusa som blir riktige for slike uttrykk når vi disambiguerer. Då kan vi seinare konvertera dei arabiske tala til tekst med rett kasus.

Kva synest de, @lynnda-hill , @ilm024 og @kathiasi ?

Metadata

Metadata

Assignees

Labels

bugSomething isn't working

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions