குரல் அங்கீகாரத்தைப் புரிந்துகொள்வது

சிக்கல்களை அகற்ற எங்கள் கருவியை முயற்சிக்கவும்





நீங்கள் சோபாவில் நிதானமாக உட்கார்ந்து கற்பனை செய்து பாருங்கள், உங்கள் கணினி அல்லது மடிக்கணினி அல்லது செல்போனை ஒரு கடிதத்தைத் தட்டச்சு செய்வது அல்லது சில கட்டளைகளைச் செய்வது போன்ற எளிய பணிகளைச் செய்யும்படி உத்தரவிடுங்கள். இது முடியுமா?

நிச்சயமாக அதுதான், அங்குதான் குரல் அங்கீகாரம் படத்தில் வருகிறது.




வரையறையின்படி செல்வது மனித பேச்சை அங்கீகரிக்கும் செயல் மற்றும் அதை உரை வடிவமாக டிகோட் செய்தது.

கொள்கை

இன் அடிப்படைக் கொள்கை குரல் அங்கீகாரம் எந்தவொரு மனிதனும் பேசும் பேச்சு அல்லது சொற்கள் ஒலி அலைகள் எனப்படும் காற்றில் அதிர்வுகளை ஏற்படுத்துகின்றன என்ற உண்மையை உள்ளடக்கியது. இந்த தொடர்ச்சியான அல்லது அனலாக் அலைகள் டிஜிட்டல் மயமாக்கப்பட்டு செயலாக்கப்பட்டு பின்னர் பொருத்தமான சொற்களுக்கும் பின்னர் பொருத்தமான வாக்கியங்களுக்கும் டிகோட் செய்யப்படுகின்றன.



குரல் அங்கீகாரம்

பேச்சு அறிதல் அமைப்பின் கூறுகள்

ஒரு அடிப்படை பேச்சு அங்கீகார அமைப்பு எதைக் கொண்டுள்ளது?

பேச்சு அறிதல் அமைப்பின் கூறுகள்

  • சாதனத்தைக் கைப்பற்றும் பேச்சு : இது ஒரு மைக்ரோஃபோனைக் கொண்டுள்ளது, இது ஒலி அலை சமிக்ஞைகளை மின் சமிக்ஞைகளாக மாற்றுகிறது மற்றும் அனலாக் டிஜிட்டல் மாற்றிக்கு மாற்றுகிறது, இது கணினி புரிந்துகொள்ளக்கூடிய தனித்துவமான தரவைப் பெற அனலாக் சிக்னல்களை மாதிரிகள் மற்றும் டிஜிட்டல் மயமாக்குகிறது.
  • டிஜிட்டல் சிக்னல் தொகுதி அல்லது செயலி : இது அதிர்வெண் கள மாற்றம் போன்ற மூல பேச்சு சமிக்ஞையில் செயலாக்கத்தை செய்கிறது, தேவையான தகவல்களை மட்டுமே மீட்டமைக்கிறது.
  • முன் செயலாக்கப்பட்ட சமிக்ஞை சேமிப்பு : பேச்சு அங்கீகாரத்தின் மேலும் பணியைச் செய்வதற்கு முன் செயலாக்கப்பட்ட பேச்சு நினைவகத்தில் சேமிக்கப்படுகிறது.
  • குறிப்பு பேச்சு வடிவங்கள் : கணினி அல்லது கணினி முன்பே வரையறுக்கப்பட்ட பேச்சு முறைகள் அல்லது நினைவகத்தில் ஏற்கனவே சேமிக்கப்பட்ட வார்ப்புருக்கள் உள்ளன, அவை பொருந்துவதற்கான குறிப்புகளாகப் பயன்படுத்தப்படுகின்றன.
  • முறை பொருந்தும் வழிமுறை : அறியப்படாத பேச்சு சமிக்ஞை உண்மையான சொற்களை அல்லது சொற்களின் வடிவத்தை தீர்மானிக்க குறிப்பு பேச்சு வடிவத்துடன் ஒப்பிடப்படுகிறது.
கணினியின் வேலை

முழு அமைப்பும் உண்மையில் எவ்வாறு இயங்குகிறது என்பதை இப்போது பார்ப்போம்.


கணினியின் வேலை

  • ஒரு உரையை ஒரு ஒலி அலைவடிவமாகக் காணலாம், அதாவது செய்தித் தகவலைக் கொண்டிருக்கும் சமிக்ஞை. ஒரு சாதாரண மனிதர் தனது / அவள் சொற்பொழிவாளர்களின் (பேச்சு உறுப்புகள்) குறைந்த அளவிலான இயக்க விகிதத்தைக் கொண்டுள்ளார், வினாடிக்கு சராசரியாக 10 ஒலிகள் என்ற விகிதத்தில் பேச்சை உருவாக்க முடியும். சராசரி தகவல் வீதம் சுமார் 50-60 பிட்கள் / வினாடி. பேச்சு சமிக்ஞையில் உண்மையில் 50 பிட்கள் / வினாடி தகவல் மட்டுமே தேவை என்பதாகும். இந்த ஒலி அலைவடிவம் மைக்ரோஃபோனால் அனலாக் மின் சமிக்ஞைகளாக மாற்றப்படுகிறது. அனலாக் டு டிஜிட்டல் மாற்றி இந்த அனலாக் சிக்னலை தனித்துவமான இடைவெளியில் அலைகளின் துல்லியமான அளவீடுகளை எடுத்து டிஜிட்டல் மாதிரிகளாக மாற்றுகிறது.
  • டிஜிட்டல் சமிக்ஞை வினாடிக்கு 16000 முறை மாதிரியாக குறிப்பிட்ட கால இடைவெளியில் சமிக்ஞைகளைக் கொண்டுள்ளது மற்றும் உண்மையானதைச் செய்ய ஏற்றது அல்ல பேச்சு அங்கீகாரம் செயல்முறை எளிதில் கண்டுபிடிக்க முடியாது என்பதால் செயல்முறை. உண்மையான தகவலைப் பிரித்தெடுக்க, நேர களத்தில் சமிக்ஞை அதிர்வெண் களத்தில் சமிக்ஞையாக மாற்றப்படுகிறது. எஃப்எஃப்டி நுட்பத்தைப் பயன்படுத்தி டிஜிட்டல் சிக்னல் செயலி இதைச் செய்கிறது. டிஜிட்டல் சிக்னலில், ஒவ்வொரு 1/100 க்குப் பிறகும் கூறுவதுஒரு நொடி பகுப்பாய்வு செய்யப்பட்டு, அத்தகைய ஒவ்வொரு கூறுக்கும் அதிர்வெண் நிறமாலை கணக்கிடப்படுகிறது. வேறு வார்த்தைகளில் கூறுவதானால், டிஜிட்டல் சமிக்ஞை அதிர்வெண் பெருக்கங்களின் சிறிய பகுதிகளாக பிரிக்கப்பட்டுள்ளது.
  • ஒவ்வொரு பிரிவு அல்லது அதிர்வெண் வரைபடம் மனிதர்களால் உருவாக்கப்பட்ட வெவ்வேறு ஒலிகளைக் குறிக்கிறது. குறிப்பிட்ட மொழியின் சேமிக்கப்பட்ட ஒலிப்புடன் அறியப்படாத பிரிவுகளின் பொருத்தத்தை கணினி செய்கிறது. இந்த முறை பொருத்தம் 3 வழிகளில் செய்யப்படுகிறது:

ஒலி ஒலிப்பு அணுகுமுறையைப் பயன்படுத்துதல் : ஒலி ஒலிப்பு அணுகுமுறையில், பொதுவாக மறைக்கப்பட்ட மார்க்கோவ் மாதிரி பயன்படுத்தப்படுகிறது. இந்த மாதிரி பேச்சு அங்கீகாரத்திற்கான நிர்ணயிக்காத நிகழ்தகவு மாதிரியை உருவாக்குகிறது. இந்த மாதிரி இரண்டு மாறிகள் கொண்டது - கணினி நினைவகத்தில் சேமிக்கப்பட்ட தொலைபேசிகளின் மறைக்கப்பட்ட நிலைகள் மற்றும் டிஜிட்டல் சிக்னலின் புலப்படும் அதிர்வெண் பிரிவு. ஒவ்வொரு ஃபோன்மீக்கும் அதன் சொந்த நிகழ்தகவு உள்ளது மற்றும் நிகழ்தகவுக்கு ஏற்ப பிரிவு ஃபோன்மேவுடன் பொருந்துகிறது மற்றும் பொருந்திய ஃபோன்மெய்கள் ஒன்றாக சேகரிக்கப்பட்டு மொழியின் சேமிக்கப்பட்ட இலக்கண விதிகளின்படி சரியான சொற்களை உருவாக்குகின்றன.

மாதிரி அங்கீகார அணுகுமுறையைப் பயன்படுத்துதல் : முறை அங்கீகார அணுகுமுறையில், எந்தவொரு மொழிக்கும் ஒரு குறிப்பிட்ட பேச்சு முறையுடன் கணினி பயிற்சியளிக்கப்படுகிறது மற்றும் அறியப்படாத பேச்சு முறை குறிப்புப் பேச்சு முறையுடன் ஒப்பிடப்படுகிறது, நேரம் போரிடும் நுட்பத்தைப் பயன்படுத்தி சமிக்ஞைகளுக்கு இடையிலான தூரத்தை தீர்மானிக்கிறது.

செயற்கை நுண்ணறிவைப் பயன்படுத்துதல் : செயற்கை நுண்ணறிவு அணுகுமுறை அடிப்படை அறிவு மூலங்களைப் பயன்படுத்துவதை அடிப்படையாகக் கொண்டது, அதாவது நிறமாலை அளவீடுகளின் அடிப்படையில் பேசப்படும் ஒலிகளின் அறிவு, சரியான அர்த்தமுள்ள மற்றும் செயற்கையான சொற்களின் அறிவு.

பேச்சு அங்கீகார அமைப்பு சார்ந்துள்ள காரணிகள்

பேச்சு அங்கீகார முறை பின்வரும் காரணிகளைப் பொறுத்தது:

  • தனிமைப்படுத்தப்பட்ட சொற்கள் : தொடர்ச்சியான சொற்களுக்கு இடையில் இடைநிறுத்தம் இருக்க வேண்டும், ஏனெனில் தொடர்ச்சியான சொற்கள் ஒன்றுடன் ஒன்று ஒரு சொல் தொடங்கும் போது அல்லது முடிவடையும் போது கணினியைப் புரிந்துகொள்வது கடினம். இதனால் தொடர்ச்சியான சொற்களுக்கு இடையே ஒரு ம silence னம் இருக்க வேண்டும்.
  • ஒற்றை சபாநாயகர் : ஒரே நேரத்தில் பேச்சு உள்ளீட்டைக் கொடுக்க முயற்சிக்கும் பல பேச்சாளர்கள் சிக்னல்களை ஒன்றுடன் ஒன்று குறுக்கிட்டு குறுக்கீடுகளை ஏற்படுத்தும். பயன்படுத்தப்படும் பேச்சு அங்கீகார அமைப்புகளில் பெரும்பாலானவை பேச்சாளர் சார்ந்த அமைப்புகள்.
  • சொல்லகராதி அளவு : பெரிய சொற்களஞ்சியம் கொண்ட மொழிகள் சிறிய சொற்களஞ்சியங்களைக் காட்டிலும் முறை பொருந்தக்கூடியதாக கருதப்படுவது கடினம், ஏனெனில் தெளிவற்ற சொற்களைக் கொண்டிருப்பதற்கான வாய்ப்புகள் பிந்தையவற்றில் குறைவாக உள்ளன.
விண்டோஸ் 7 இல் பேச்சு அறிதல் அமைப்பு

பேச்சு அங்கீகார முறைக்கு விண்டோஸ் 7 ஐப் பயன்படுத்தும் எந்தவொரு நபருக்கும் பின்வரும் படிகளைப் பரிந்துரைக்க விரும்புகிறேன்

  • தொடக்க மெனுவிலிருந்து கண்ட்ரோல் பேனலைத் திறக்கவும் அல்லது ஐகானைக் கிளிக் செய்வதன் மூலம் திறக்கவும்.
  • அணுகல் எளிமை என்பதைத் தேர்ந்தெடுத்து, பேச்சு அங்கீகாரம் என்பதைக் கிளிக் செய்க.
  • அடுத்து மைக்ரோஃபோனை அமைத்து கிளிக் செய்து, கிடைக்கும் விருப்பங்களிலிருந்து டெஸ்க்டாப் மைக்ரோஃபோனைத் தேர்ந்தெடுக்கவும்.
  • அடுத்து பேச்சு டுடோரியலை எடுத்து கொடுக்கப்பட்ட வழிமுறைகளைப் பின்பற்றவும்.
  • அதன் பிறகு, சிறந்த விருப்பங்களுக்காக உங்கள் கணினியைப் பயிற்றுவிக்கவும், இதனால் கணினி உங்கள் பேச்சு சமிக்ஞையின் திட்டவட்டமான வடிவத்தை சேமிக்கிறது. ‘உங்களை நன்கு புரிந்துகொள்ள உங்கள் கணினியைப் பயிற்றுவிக்கவும்’ விருப்பத்தைக் கிளிக் செய்வதன் மூலம் இது செய்யப்படுகிறது, பின்னர் வழிமுறைகளைப் பின்பற்றுகிறது.
  • இப்போது பேச்சு அங்கீகார ஐகானைத் தொடங்கி, உங்கள் பேச்சை கணினிக்கு ஆணையிடத் தொடங்குங்கள். கணினி அகராதியில் உங்கள் சொந்த சொற்களையும் சேர்க்கலாம்.
நடைமுறை பேச்சு அங்கீகார அமைப்புகள்: HM2007 ஐப் பயன்படுத்துதல்

பேச்சு அங்கீகாரம் ஐசியைப் பயன்படுத்தி ஒரு நடைமுறை பேச்சு அங்கீகார முறையை உருவாக்க முடியும் HM2007 . HM2007 என்பது 48 முள் ஐசி ஆகும், இது பேச்சு அங்கீகார செயல்பாட்டை வழங்குகிறது. இது இரண்டு முறைகளில் செயல்படுகிறது: கையேடு முறை அல்லது CPU பயன்முறை. இரண்டு முறைகளிலும், விசையில் அழுத்தும் தொடர்புடைய எண்ணிற்கான ஒவ்வொரு வார்த்தையையும் பயனரால் சொல்லும் சொற்களை அடையாளம் காண ஐசி முதலில் பயிற்சி பெறுகிறது. ஐசி ஒவ்வொரு சொல் சமிக்ஞையையும் நினைவக இடத்தில் சேமிக்கிறது. ஐசியிலிருந்து தரவு வெளியீடு மைக்ரோகண்ட்ரோலருடன் எல்சிடியில் காட்டப்படும் இடத்திலிருந்து இணைக்கப்படுகிறது.

நடைமுறை பேச்சு அங்கீகார அமைப்புகள்

பொதுவாக HM2007 செயல்பாட்டிற்கு கையேடு பயன்முறையைப் பயன்படுத்துகிறோம்.

  • HM2007 ஒரு RDY முள் கொண்டிருக்கிறது, இது செயலில் குறைந்த முள் ஆகும், இது பயிற்சி நோக்கத்திற்காக ஐசி தயாராக உள்ளது என்பதைக் குறிக்கிறது.
  • ஐசியின் MICIN முள் இணைக்கப்பட்ட மைக்ரோஃபோன் மூலம் குரல் உள்ளீடு வழங்கப்படும்.
  • ஐசி ஒரு விசைப்பலகையுடன் இணைக்கப்பட்டுள்ளது, இது ஒவ்வொரு வார்த்தைக்கும் தொடர்புடைய எண் உள்ளீட்டை வழங்க பயன்படுகிறது. ஐ.சி தெளிவான மற்றும் ரயில் என இரண்டு செயல்பாடுகளில் செயல்படுகிறது. விசைப்பலகையில் ரயில் விசையை அழுத்தும்போது, ​​ஐசி அதன் பயிற்சி செயல்முறையைத் தொடங்குகிறது.
  • பயனர் ‘ரயில்’ செயல்பாட்டு விசையை அழுத்துவதற்கு முன் ஒரு எண் விசையை அழுத்தி, மைக்ரோஃபோனுக்கு தேவையான வார்த்தையைச் சொல்கிறார்.
  • ஐஆர் உயர் சமிக்ஞையை ME (மெமரி இயக்கு) முள் அனுப்புகிறது, இது SRAM இன் ME முள் உடன் இணைக்கப்பட்டுள்ளது. அழுத்திய எண்ணுடன் தொடர்புடைய 8 பிட் தரவு சமிக்ஞை வெளிப்புற பஸ் வழியாக எஸ்ஆர்ஏஎம் (வெளிப்புற ரேம்) இல் சேமிக்கப்படுகிறது.
  • குரல் உள்ளீடு கண்டறியப்பட்ட பிறகு, RDY முள் தர்க்கரீதியாக உயர்ந்தது மற்றும் ஐசி அங்கீகார நிலைக்கு வருகிறது, அங்கு அது அங்கீகார செயல்முறையைத் தொடங்குகிறது.
  • செயல்முறையின் முடிவு DEN (Data Enable) முள் உயர்வுடன் தரவு பஸ் மூலம் வழங்கப்படுகிறது.
  • 8 பிட் தரவை மைக்ரோகண்ட்ரோலருக்கு ஒரு தொடர் இடைமுக செயலி மூலம் கொடுக்கலாம் அல்லது முதலில் தாழ்ப்பாள் ஐசி 74 எச்.சி .573 ஐப் பயன்படுத்தி இணைக்கலாம்.
  • மைக்ரோகண்ட்ரோலர் ஒரு எல்சிடியுடன் இடைமுகப்படுத்தப்பட்டு, அதனுடன் தொடர்புடைய சொல் காட்சிக்கு காட்டப்படும் வகையில் திட்டமிடப்பட்டுள்ளது.

ஒரே மாதிரியான முன்னெச்சரிக்கை ஹோமோனிம்களை (ஒத்த ஒலியுடன் கூடிய சொற்கள்) பயன்படுத்தக்கூடாது என்பதும், குரலில் உற்சாகத்தை கவனித்துக்கொள்வதும் ஆகும்.

எனவே, இது எப்படி ஒரு அடிப்படை பேச்சு அங்கீகார அமைப்பு வேலை செய்கிறது. மேலும் உள்ளீடுகள் சேர்க்கப்படுவது வரவேற்கத்தக்கது.

பட கடன்

பேச்சு மற்றும் பேச்சாளர் அங்கீகாரத்திற்கான அறிமுகம் மூலம் பேச்சு அங்கீகார அமைப்பின் கூறுகள் - ரிச்சர்ட் டி. மயில் மற்றும் டேரில் எச். கிராஃப்