القاهرة : الأمير كمال فرج.
الكتب الصوتية سوق تتوسع بسرعة، حيث تتوقع شركة الاستشارات التجارية Grand View Research أن يصل حجم سوق الكتب المسموعة إلى 15 مليار دولار أمريكي بحلول عام 2027.
وللكتب المسموعة فوائد جمة، فهي رخيصة التكلفة، واسعة الإنتشار، يمكن للمستخدم سماعها أثناء ممارسة أعمال أخرى، ليس ذلك فقط، ذكرت دراسة أن 63% من المليونيرات يسمعون الكتب المسموعة خلال تنقلاتهم الصباحية.
كتب ديفيد أ. تيش في تقرير نشرته مجلة Forbes أن "مشكلة تلبية هذا التوقع أو تجاوزه تكمن في التحدي المتمثل في إنتاج كميات من الكتب الصوتية، ولكن الخبر السار هو أن الذكاء الاصطناعي (AI) يمكن أن يوفر تقنية يمكنها تبسيط إنتاج الكتب الصوتية وتلبية الطلب المتزايد باستمرار".
بينما يتزايد الطلب على الكتب الصوتية، يواجه إنتاج هذه الكتب العديد من التحديات الإجرائية. تعمل الشركات على إنشاء المزيد من الكتب الإلكترونية، ولكن إلقاء نظرة سريعة عليها يظهر أن التنسيق لا يزال يمثل تحديًا.
تحديات مختلفة
ضع في اعتبارك أن التحدي المتمثل في إنتاج الكتب الإلكترونية من الكتب المطبوعة ضئيل مقارنةً بإنشاء الكتب الصوتية. ليس من الضروري أن يفهم الكتاب الإلكتروني السياق أو الأحرف، لكن الشخص الذي يقرأ النص يفهم ذلك.
الرقمنة هي أيضًا أسرع بكثير مما يحتاجه الشخص لقراءة كتاب. حتى بعد تسجيل القراءة، قد تظل هناك حاجة إلى إجراء تعديلات كبيرة. هذا هو السبب في أن تقديرات الإنشاء الاحترافي لكتاب صوتي تميل إلى أن تكون بآلاف الدولارات، بحد أدنى 2-3 آلاف دولار ومتوسط 5-10 آلاف دولار.
وهذا يعني أن العديد من الناشرين يركزون فقط على ما يتوقعون أن يكون الأفضل مبيعًا، وسيكون لديهم مخزونًا كبيرًا من الكتب التي لا يمكنهم تحمل تكاليف تسجيلها.
هناك أيضًا مسألة اللهجات واللغات. ما هي تكلفة إنشاء نسخ مخصصة من الكتب لأجزاء مختلفة من الولايات المتحدة، حيث يعتقد الناشر أن الكتاب سيبيع بشكل أفضل؟ ويكون الأكثر إثارة للاهتمام ، ماذا عن الكلمات ذات النطق المختلف في أماكن مختلفة؟، يتم نطق فرساي Versailles بشكل مختلف تمامًا عند الإشارة إلى مكان في كنتاكي، عما هو عليه عند الإشارة إلى القصر الشهير في فرنسا.
الذكاء الاصطناعي الحل
للعديد من أسباب الإنتاج ، Speechki هي شركة تركز على معالجة سوق الكتب الصوتية. إنهم يستخدمون الذكاء الاصطناعي لتسريع عملية إنشاء الكتب الصوتية. تتمثل الخطوة الأولى في تجاوز الرقمنة البسيطة للكتاب المستخدم في إنشاء الكتب الإلكترونية.
قالت ديما أبراموف، المؤسس المشارك والرئيس التنفيذي لشركة Speechki: إن "الذكاء الاصطناعي ضروري عند قراءة النص لأول مرة". "يجب تحديد الشخصيات المختلفة، ويجب تحديد شدة الصوت المقترحة من سياق النص، والمعلومات الأساسية الأخرى لتقديم تجربة قراءة أفضل." إنه ليس نصًا رقميًا موثقًا فحسب، بل يتم أيضًا إنشاء البيانات الوصفية من أجل دفع التسجيل الصوتي.
بعد ذلك، تستخدم الشركة الذكاء الاصطناعي لإدارة أكثر من خمسين صوتًا إنكليزيًا بلهجات أمريكية مختلفة، وأكثر من 200 صوت لهجات ولغات أخرى. يمكن بعد ذلك إنشاء كتاب صوتي تقريبي بترتيب قصير جدًا، بما في ذلك استخدام أصوات مختلفة لسماعات متعددة.
في هذه المرحلة، يعمل المستمعون البشريون داخل النظام لتصحيح المشكلات وتكييفها. على سبيل المثال، لا تحدد هذه التقنية المبكرة الأجناس والأعمار وتفاصيل الشخصيات الأخرى. يمكن للمستمعين التعليق على البيانات الوصفية، ويمكن بعد ذلك تغيير الأصوات تلقائيًا.
يمكن أيضًا تدريس طرق نطق محددة للنظام، سواء كان مصطلح فرساي المناسب أو مصطلحًا تقنيًا جديدًا. يعد تدريب النظام ثم جعل النظام يصحح النص أسرع بكثير وأقل تكلفة من تسجيل موهبة صوتية إصدارا جديدا.
تجزئة السوق
عند العمل مع العملاء، من المهم دائمًا فهم قطاعات السوق بشكل أفضل. الانقسام الأكثر وضوحًا هو بين الكتب الخيالية وغير الخيالية. قال بيل ولفستال، مستشار النشر في Speechki ، "يبيع أكثر الكتب مبيعًا في مجال الروايات الخيالية أكثر من الكتب الأكثر مبيعًا غير الخيالية". "ومع ذلك، فإن الكتب الواقعية لها ذيل أطول، مع بيع بقية الكتب بشكل أكثر اتساقًا بمرور الوقت." هذا يعني أنه في حين أن الناشرين في كلا الجزأين مثيرون للاهتمام، فإن الناشرين غير الخياليين لديهم المزيد من الكتب التي قد تكون جذابة لإنتاج الكتب المسموعة.
قال ولفستال إن "النشر الأكاديمي يعد جزءًا فرعيًا رئيسيًا، حيث يوجد العديد من الكتب غير الخيالية الموجودة في قوائم جردها والتي يمكن أن تجلب مبيعات لتغطية التكاليف المنخفضة". "إن خفض تكلفة الكتب الصوتية إلى أقل من ألف دولار يفتح الكثير من المخزون المنشور للإنتاج المحتمل".
تسهيل النشر الذاتي
إلى جانب الفرصة في النشر الأكاديمي والشركات ، يشير Speechki إلى أن ما يقرب من نصف جميع الكتب الجديدة تُنشر ذاتيًا. ستظهر نظرة سريعة على الإنترنت الكثير من الخطوات المعقدة والشاملة للمؤلف لإنشاء كتاب صوتي. من هنا تبرز أهمية تزويد المؤلفين المستقلين بطريقة لإضافة خيار الصوت بسرعة وبتكلفة زهيدة.
بالإضافة إلى الكتب الإلكترونية، من الواضح أن هذه التكنولوجيا سوف تصلح نفسها للإنتاج الصوتي الآخر. فكر في النصوص، من عروض الشركات إلى الأفلام. يمكن أن يؤدي تسريع عملية مقاطع التدريب والندوات عبر الإنترنت وغير ذلك إلى تعزيز علاقة العمل بقاعدة العملاء، مما يوفر وقت إنتاج أسرع يمكنه دفع المزيد من المحتوى.
في الأفلام، يمكن أن يساعد تشغيل نسخة صوتية أولية كتّاب السيناريو ومنتجي الفيلم على التفكير في الخطوط بطريقة مرتبطة بشكل مباشر بطريقة تحدث الناس.
فرص أخرى
يركز Speechki على الكتب الصوتية، لكن الفرص الأخرى تقود عددًا من المناقشات مع شركاء محتملين في أماكن أخرى. هذا سوق جديد للذكاء الاصطناعي ، وهناك فرص للعديد من اللاعبين.
ركزت الكثير من تغطية السوق على روبوتات المحادثة، في النص والصوت. لقد أصبحوا سريعًا ، إذا لم يكونوا قد أصبحوا بالفعل ، "ضرورية" في العمل. ولكن لا تقتصر الفرص الصوتية على الدردشة.
بينما يبدو أن عددًا أقل من الأشخاص يقرؤون الكتب كل عام، فمن الواضح أيضًا أن الكتب لا تزال مطلوبة بشدة. تعتبر الكتب الصوتية سوقًا متنامية والذكاء الاصطناعي هو أداة بدأ تطبيقها لمعالجة هذا السوق.