چکیدهما در عصری زندگی میکنیم که حجم اطلاعات با سرعت زیادی در حال افزایش است و این اطلاعات در سراسر جهان در بستر اینترنت پراکنده شده است. این حجم عظیم اطلاعات میتواند به عنوان منبع ایدههای جدید برای مسائلی که هنوز مطرح نشده است شناخته شود. یافتن این ایدهها و راهحلها به صورت دستی و با کمک افراد خبره هزینه بردار و زمانبر خواهد بود.روش کاوش ایده از دادههای متنی روشی اتوماتیک است که در سال 2009 مطرح شد. روش کاوش ایده فرایندی است که ایدههای جدید و مفید را از متنهای غیر ساختار یافته استخراج میکند. در این روش تعریف ایده همان تعریف تکنولوژیکی آن است که برای حل مسائل تکنولوژیکی از آن استفاده میشود. این روش با بهرهگیری از روشهای کاوش متن و یک روش جدید به نام کاوش ایده از متنهای موجود ایدهها را استخراج میکند و آنها را از لحاظ جدید و مفید بودن مورد ارزیابی قرار میدهد. این روش میتواند کاربردهای زیادی در زمینههای مختلف از جمله زمینه کسب و کار داشته باشد و سبب سرعت بخشیدن به فرایندهای کسب و کار شود با پیاده سازی این روش در زبان فارسی میتواند تمام این قابلیتها را برای شرکتها و سازمانها فراهم سازد و آنها را زمانی که با مشکلی مواجه میشوند را یاری کند تا بتوانند از لابهلای حجم عظیم اطلاعات موجود در کوتاهترین زمان و با کمترین هزینه راهحل مفید و جدید را بدست آورند. در این پژوهش روش کاوش ایده را با زبان فارسی پیادهسازی کرده و از آن در پیادهسازی سیستمهای خبره به عنوان کاربردی جدید برای این روش استفاده کردهایم. همانطور که میدانیم هم اکنون بیشترین سرمایهگذاری شرکتها و سازمانها روی دانش سازمانی است بنابراین مکانیزه کردن یافتن دانش جدید و غنیسازی پایگاه دانش میتواند میزان هزینه شرکتها و سازمانها را در این زمینه کاهش داده و باعث تسریع این فرایند شود.کلمات کلیدی:کاوش ایده، متنهای غیر ساختاریافته،مسائل تکنولوژیکی، سیستمهای خبره، پایگاه دانش.فهرست مطالبعنوان صفحهفصل اول: مقدمه و کلیات تحقیق.. 101- 1 مقدمه:111-2 تعریف مسأله و سوالات اصلی تحقیق.. 121-3 فرضیهها121-4 موضوع و اهداف پژوهش.. 121-5 روش تحقیق.. 131-6 جنبههای نوآوری.. 131-7 مراحل انجام تحقیق.. 131-8 مروری اجمالی به چندی از تحقیقات و مطالعات انجام گرفته. 141-9 ساختار پایاننامه. 15فصل دوم: ادبیات تحقیق.. 162-1 مقدمه. 172-2 کاوش متن. 192-3 ایده چیست.. 212-4 اساس و پایه در پشت ایجاد ایده222-5 فرایند کاوش ایده242-5-1 نتایج استفاده از روش کاوش ایده292-5-2 ارزیابی روش کاوش ایده302-6 کاربردهای روش کاوش ایده322-6-1 استفاده از کاوش ایده در نوآوری سرویس در زنجیره ارزش کسب و کار. 322-6-2 کاوش ایده برای پشتیبانی از توسعه و تحقیقات درباره محصول جدید. 342-7 سیستمهای خبره352-7-1 مفاهیم سیستمهای خبره372-7-2 توسعه سیستمهای خبره392-7-3 فرایند مهندسی دانش.. 402-7-4 مراحل فرایند مهندسی دانش.. 412-7-5 مرحله کشف دانش.. 43فصل سوم : روش تحقیق.. 463-1 مقدمه. 473-2 روش تحقیق.. 473-2-1 بر اساس هدف تحقیق.. 473-2-2 بر اساس نحوه گردآوری دادهها(تحقیق توصیفی):493-3 متغیرهای تحقیق.. 513-4 روشهای جمع آوری اطلاعات.. 513-5 جامعه آماری.. 513-5 روشهای تجزیه و تحلیل اطلاعات.. 52فصل چهارم: رهیافت جدید پیشنهادی.. 544-1 مقدمه. 554-2 روش کاوش ایده به زبان فارسی.. 554-3 استفاده از روش کاوش ایده در فرایند مهندسی دانش.. 624-4 مزایا و معایب استفاده از روش کاوش ایده در فرایند مهندسی دانش.. 64فصل پنجم : نتیجه گیری.. 661-5 نتیجهگیری.. 675-1 پیشنهادها و یافتههای تحقیق.. 68منابع. 70Abstract. 72 فهرست جداولعنوان صفحهجدول 1-2 تفاوت سیستمهای خبره با سیستمهای متعارف....................................................33جدول 2-2: مفاهیم سیستمهای خبره و متعارف .....................................................................34جدول 4-1 مقایسه روش کاوش ایده با دیگر روشها در مکانیزه کردن کشف دانش..............64 فهرست تصاویر و نمودارهاعنوان صفحهشکل 2-1: فرایند رویکرد کاوش ایده.......................................................................................21شکل 2-2: چارچوب نوآوری- معماری سیستم......................................................................31شکل 3-2 : ساختار سیستم خبره..............................................................................................35شکل 4-2 : فرایند مهندسی دانش.............................................................................................39شکل 1-4: استفاده از روش کاوش ایده در فرایند مهندسی دانش............................................56 فصل اول: مقدمه و کلیات تحقیق 1- 1 مقدمه:حجم اطلاعات در سالهای اخیر با رشد چشمگیری در حال افزایش است و از طرفی سازمانها و شرکتها نیز هر روزه با مسائل و مشکلات جدید روبهرو میشوند که شاید راهحل بسیاری از این مسائل در این توده عظیم اطلاعات باشد که در جای جای دنیا در بستری به نام اینترنت پراکنده شده و یا به صورت اسناد، مقالات، گزارشات و... در بایگانی شرکتها و سازمانها قرار دارد. بسیاری از سازمانها با استفاده از افراد خبره در زمینههای مختلف سعی بر آن داشته که بتوانند راهحلهایی برای این مسائل پیدا کنند که مطمئناً زمانبر و پر هزینه خواهد بود. روش کاوش ایده[1] راهحلی برای این موضوع است تا با پیدا کردن راهحل برای مسایل موجود به صورت مکانیزه در زمان و هزینه به صورت کارا صرفهجویی کنیم. کاوش متن[2] یا کشف دانش از متنها به صورت کلی به فرایند استخراج اطلاعات و دانش مفید از متنهای غیر ساختار یافته ارجاع داده میشود. با ارجاع به این کاوش ایده، فرایند اتوماتیکی برای استخراج ایدههای مفید و جدید از متن غیر ساختار یافته[3] با استفاده از متدهای کاوش متن است و هدف این روش اگرچه پیدا کردن ایدههای جدید و مفید است اما اغلب ارائه دادن این ایدهها به صورت قابل درک برای کاربر است [7,8]. این روش در وزارت دفاع آلمان برای اولین بار به کار گرفته شد و با استفاده از افراد خبره مورد ارزیابی قرار گرفت. نتایج حاصل از این تحقیق نشان داد که این روش کارایی لازم را دارد اگرچه به دلیل حساس بودن نتایج برای وزارت دفاع المان این نتایج مخفی ماند اما در نهایت این روش برای مسایل مختلف در این وزارت مورد استفاده قرار گرفت و راهحلهای مفیدی را برای مسائل مختلف آن پیدا کرد. 1-2 تعریف مسأله و سوالات اصلی تحقیقدر راستای پیاده سازی و استفاده از روش کاوش ایده سوالات زیر را میتوان مطرح کرد:در این مسأله فرض بر این است که یک مسأله وجود دارد و متنهای زیادی در قالب مقالات، اسناد،گزارشات و ... وجود دارند که احتمالاً راهحل این مسأله در آنها وجود دارد، هدف پیدا کردن راهحل این مسأله از این متنها به وسیله یک رویکرد خودکار است که سبب میشود استخراج ایدهها و راهحلها بسیار سریعتر و ارزانتر انجام شود.هدف از این پایاننامه ایجاد برنامه کاربردی روش کاوش ایده به زبان فارسی است تا بتوان از منابع و مقالات موجود به زبان فارسی ایدههای جدید و مفید را برای حل مسأئل موجود پیدا کرد. همچنین استفاده از این روش در پیادهسازی سیستمهای خبره[5] است در واقع از این روش برای گرداوری دانش[6] در فرایند مهندسی دانش[7] استفاده شود تا این روش را هر چه بیشتر کاربردی شود.روش انجام این تحقیق مطالعه و گرداوری اطلاعات لازم در زمینه روش کاوش ایده است که نتایج را میتوان با نمونه انگلیسی آن ارزیابی کرد و همچنین مطالعه در زمینه سیستمهای خبره است که این روش میتواند به بهبود مراحل مهندسی آن کمک کند. 1-6 جنبههای نوآوریبا پیادهسازی این روش به زبان فارسی یکی از روشهای جدید در زمینه متنکاوی برای متون فارسی وجود خواهد داشت و با به کار بردن آن در سیستمهای خبره راه جدیدی برای گردآوری دانش و غنی سازی پایگاه دانش به وجود خواهد آمد.روش کاوش ایده اولین بار در سال 2008 توسط Dirk Thorleuchter, Dirk Van den Poel در یک پروژه تحقیقی برای وزارت دفاع آلمان معرفی شد که از تکنیکهای کاوش متن برای بدست آوردن ایدههای جدید استفاده کردند [8].آنها در سال 2009 رویکرد کاوش ایده را با درجه دقت بیشتری ارائه دادند. برای این رویکرد بر اساس فرضیات موجود برنامه کاربردی طراحی شده و روی اینترنت قرار داده شده است. در این سایت که چندین زبان را پشتیبانی میکند میتوان کاربرد این روش را مشاهده کرد بدین منظور تنها لازم است که کاربر متنی که مسأله را بیان کرده و متنی که احتمال وجود راهحل برای مسأله مورد نظر در آن است را وارد کند تا در نهایت جواب را دریافت کند که به صورت متنی است که ایدههای جدید پیدا شده در متن را به صورت جمله به کاربر نشان میدهد [7]. بعد از اینکه این روش مطرح شد استفادههای مختلف از آن در زمینههای گوناگون مطرح شد. در مقاله [9] از روش کاوش ایده به منظور ایجاد سرویسهای جدید برای بهبود کسب و کار با استفاده از اطلاعات موجود در اینترنت و مقالههای تحقیقی استفاده میکند. در واقع از این روش به منظور هدفگرا کردن جستجو در صفحات وب به جای استفاده از موتورهای جستجوی ساده استفاده میکنند تا بتوانند بحثهای کاربران را در وبلاگها و پیامها شناسایی و پردازش کنند و همچنین بتوانند آیتمهای جدیدی که مورد علاقه کاربران واقع شده است را شناسایی کنند و با استفاده از این کاوش سرویسهای جدید را به منظور رقابت با رقبا ارائه میدهد و همچنین مقاله [10,11]است که در آن از کاوش ایده به منظور نوآوری در محصول و توسعه و تحقیق درباره محصول جدید با استفاده از کاوش متنهای اینترنتی که بیانگر نیازهای مصرفکنندگان است استفاده میکند و علاوه بر آن از روش کاوش ایده به منظور کاوش وب[8] برای پیدا کردن مشتریان و شرکتهای سودآور استفاده میکند. [1]Idea mining[2] Text mining[3] Unstructured text[4]Jaccards coefficient[5]Expert systems[6]Knowledge acquisition[7]knowledge-engineering process[8] Web mining
کاوش ایده در متنهای فارسی WORD
چکیدهما در عصری زندگی میکنیم که حجم اطلاعات با سرعت زیادی در حال افزایش است و این اطلاعات در سراسر جهان در بستر اینترنت پراکنده شده است. این حجم عظیم اطلاعات میتواند به عنوان منبع ایدههای جدید برای مسائلی که هنوز مطرح نشده است شناخته شود. یافتن این ایدهها و راهحلها به صورت دستی و با کمک افراد خبره هزینه بردار و زمانبر خواهد بود.روش کاوش ایده از دادههای متنی روشی اتوماتیک است که در سال 2009 مطرح شد. روش کاوش ایده فرایندی است که ایدههای جدید و مفید را از متنهای غیر ساختار یافته استخراج میکند. در این روش تعریف ایده همان تعریف تکنولوژیکی آن است که برای حل مسائل تکنولوژیکی از آن استفاده میشود. این روش با بهرهگیری از روشهای کاوش متن و یک روش جدید به نام کاوش ایده از متنهای موجود ایدهها را استخراج میکند و آنها را از لحاظ جدید و مفید بودن مورد ارزیابی قرار میدهد. این روش میتواند کاربردهای زیادی در زمینههای مختلف از جمله زمینه کسب و کار داشته باشد و سبب سرعت بخشیدن به فرایندهای کسب و کار شود با پیاده سازی این روش در زبان فارسی میتواند تمام این قابلیتها را برای شرکتها و سازمانها فراهم سازد و آنها را زمانی که با مشکلی مواجه میشوند را یاری کند تا بتوانند از لابهلای حجم عظیم اطلاعات موجود در کوتاهترین زمان و با کمترین هزینه راهحل مفید و جدید را بدست آورند. در این پژوهش روش کاوش ایده را با زبان فارسی پیادهسازی کرده و از آن در پیادهسازی سیستمهای خبره به عنوان کاربردی جدید برای این روش استفاده کردهایم. همانطور که میدانیم هم اکنون بیشترین سرمایهگذاری شرکتها و سازمانها روی دانش سازمانی است بنابراین مکانیزه کردن یافتن دانش جدید و غنیسازی پایگاه دانش میتواند میزان هزینه شرکتها و سازمانها را در این زمینه کاهش داده و باعث تسریع این فرایند شود.کلمات کلیدی:کاوش ایده، متنهای غیر ساختاریافته،مسائل تکنولوژیکی، سیستمهای خبره، پایگاه دانش.فهرست مطالبعنوان صفحهفصل اول: مقدمه و کلیات تحقیق.. 101- 1 مقدمه:111-2 تعریف مسأله و سوالات اصلی تحقیق.. 121-3 فرضیهها121-4 موضوع و اهداف پژوهش.. 121-5 روش تحقیق.. 131-6 جنبههای نوآوری.. 131-7 مراحل انجام تحقیق.. 131-8 مروری اجمالی به چندی از تحقیقات و مطالعات انجام گرفته. 141-9 ساختار پایاننامه. 15فصل دوم: ادبیات تحقیق.. 162-1 مقدمه. 172-2 کاوش متن. 192-3 ایده چیست.. 212-4 اساس و پایه در پشت ایجاد ایده222-5 فرایند کاوش ایده242-5-1 نتایج استفاده از روش کاوش ایده292-5-2 ارزیابی روش کاوش ایده302-6 کاربردهای روش کاوش ایده322-6-1 استفاده از کاوش ایده در نوآوری سرویس در زنجیره ارزش کسب و کار. 322-6-2 کاوش ایده برای پشتیبانی از توسعه و تحقیقات درباره محصول جدید. 342-7 سیستمهای خبره352-7-1 مفاهیم سیستمهای خبره372-7-2 توسعه سیستمهای خبره392-7-3 فرایند مهندسی دانش.. 402-7-4 مراحل فرایند مهندسی دانش.. 412-7-5 مرحله کشف دانش.. 43فصل سوم : روش تحقیق.. 463-1 مقدمه. 473-2 روش تحقیق.. 473-2-1 بر اساس هدف تحقیق.. 473-2-2 بر اساس نحوه گردآوری دادهها(تحقیق توصیفی):493-3 متغیرهای تحقیق.. 513-4 روشهای جمع آوری اطلاعات.. 513-5 جامعه آماری.. 513-5 روشهای تجزیه و تحلیل اطلاعات.. 52فصل چهارم: رهیافت جدید پیشنهادی.. 544-1 مقدمه. 554-2 روش کاوش ایده به زبان فارسی.. 554-3 استفاده از روش کاوش ایده در فرایند مهندسی دانش.. 624-4 مزایا و معایب استفاده از روش کاوش ایده در فرایند مهندسی دانش.. 64فصل پنجم : نتیجه گیری.. 661-5 نتیجهگیری.. 675-1 پیشنهادها و یافتههای تحقیق.. 68منابع. 70Abstract. 72 فهرست جداولعنوان صفحهجدول 1-2 تفاوت سیستمهای خبره با سیستمهای متعارف....................................................33جدول 2-2: مفاهیم سیستمهای خبره و متعارف .....................................................................34جدول 4-1 مقایسه روش کاوش ایده با دیگر روشها در مکانیزه کردن کشف دانش..............64 فهرست تصاویر و نمودارهاعنوان صفحهشکل 2-1: فرایند رویکرد کاوش ایده.......................................................................................21شکل 2-2: چارچوب نوآوری- معماری سیستم......................................................................31شکل 3-2 : ساختار سیستم خبره..............................................................................................35شکل 4-2 : فرایند مهندسی دانش.............................................................................................39شکل 1-4: استفاده از روش کاوش ایده در فرایند مهندسی دانش............................................56 فصل اول: مقدمه و کلیات تحقیق 1- 1 مقدمه:حجم اطلاعات در سالهای اخیر با رشد چشمگیری در حال افزایش است و از طرفی سازمانها و شرکتها نیز هر روزه با مسائل و مشکلات جدید روبهرو میشوند که شاید راهحل بسیاری از این مسائل در این توده عظیم اطلاعات باشد که در جای جای دنیا در بستری به نام اینترنت پراکنده شده و یا به صورت اسناد، مقالات، گزارشات و... در بایگانی شرکتها و سازمانها قرار دارد. بسیاری از سازمانها با استفاده از افراد خبره در زمینههای مختلف سعی بر آن داشته که بتوانند راهحلهایی برای این مسائل پیدا کنند که مطمئناً زمانبر و پر هزینه خواهد بود. روش کاوش ایده[1] راهحلی برای این موضوع است تا با پیدا کردن راهحل برای مسایل موجود به صورت مکانیزه در زمان و هزینه به صورت کارا صرفهجویی کنیم. کاوش متن[2] یا کشف دانش از متنها به صورت کلی به فرایند استخراج اطلاعات و دانش مفید از متنهای غیر ساختار یافته ارجاع داده میشود. با ارجاع به این کاوش ایده، فرایند اتوماتیکی برای استخراج ایدههای مفید و جدید از متن غیر ساختار یافته[3] با استفاده از متدهای کاوش متن است و هدف این روش اگرچه پیدا کردن ایدههای جدید و مفید است اما اغلب ارائه دادن این ایدهها به صورت قابل درک برای کاربر است [7,8]. این روش در وزارت دفاع آلمان برای اولین بار به کار گرفته شد و با استفاده از افراد خبره مورد ارزیابی قرار گرفت. نتایج حاصل از این تحقیق نشان داد که این روش کارایی لازم را دارد اگرچه به دلیل حساس بودن نتایج برای وزارت دفاع المان این نتایج مخفی ماند اما در نهایت این روش برای مسایل مختلف در این وزارت مورد استفاده قرار گرفت و راهحلهای مفیدی را برای مسائل مختلف آن پیدا کرد. 1-2 تعریف مسأله و سوالات اصلی تحقیقدر راستای پیاده سازی و استفاده از روش کاوش ایده سوالات زیر را میتوان مطرح کرد:در این مسأله فرض بر این است که یک مسأله وجود دارد و متنهای زیادی در قالب مقالات، اسناد،گزارشات و ... وجود دارند که احتمالاً راهحل این مسأله در آنها وجود دارد، هدف پیدا کردن راهحل این مسأله از این متنها به وسیله یک رویکرد خودکار است که سبب میشود استخراج ایدهها و راهحلها بسیار سریعتر و ارزانتر انجام شود.هدف از این پایاننامه ایجاد برنامه کاربردی روش کاوش ایده به زبان فارسی است تا بتوان از منابع و مقالات موجود به زبان فارسی ایدههای جدید و مفید را برای حل مسأئل موجود پیدا کرد. همچنین استفاده از این روش در پیادهسازی سیستمهای خبره[5] است در واقع از این روش برای گرداوری دانش[6] در فرایند مهندسی دانش[7] استفاده شود تا این روش را هر چه بیشتر کاربردی شود.روش انجام این تحقیق مطالعه و گرداوری اطلاعات لازم در زمینه روش کاوش ایده است که نتایج را میتوان با نمونه انگلیسی آن ارزیابی کرد و همچنین مطالعه در زمینه سیستمهای خبره است که این روش میتواند به بهبود مراحل مهندسی آن کمک کند. 1-6 جنبههای نوآوریبا پیادهسازی این روش به زبان فارسی یکی از روشهای جدید در زمینه متنکاوی برای متون فارسی وجود خواهد داشت و با به کار بردن آن در سیستمهای خبره راه جدیدی برای گردآوری دانش و غنی سازی پایگاه دانش به وجود خواهد آمد.روش کاوش ایده اولین بار در سال 2008 توسط Dirk Thorleuchter, Dirk Van den Poel در یک پروژه تحقیقی برای وزارت دفاع آلمان معرفی شد که از تکنیکهای کاوش متن برای بدست آوردن ایدههای جدید استفاده کردند [8].آنها در سال 2009 رویکرد کاوش ایده را با درجه دقت بیشتری ارائه دادند. برای این رویکرد بر اساس فرضیات موجود برنامه کاربردی طراحی شده و روی اینترنت قرار داده شده است. در این سایت که چندین زبان را پشتیبانی میکند میتوان کاربرد این روش را مشاهده کرد بدین منظور تنها لازم است که کاربر متنی که مسأله را بیان کرده و متنی که احتمال وجود راهحل برای مسأله مورد نظر در آن است را وارد کند تا در نهایت جواب را دریافت کند که به صورت متنی است که ایدههای جدید پیدا شده در متن را به صورت جمله به کاربر نشان میدهد [7]. بعد از اینکه این روش مطرح شد استفادههای مختلف از آن در زمینههای گوناگون مطرح شد. در مقاله [9] از روش کاوش ایده به منظور ایجاد سرویسهای جدید برای بهبود کسب و کار با استفاده از اطلاعات موجود در اینترنت و مقالههای تحقیقی استفاده میکند. در واقع از این روش به منظور هدفگرا کردن جستجو در صفحات وب به جای استفاده از موتورهای جستجوی ساده استفاده میکنند تا بتوانند بحثهای کاربران را در وبلاگها و پیامها شناسایی و پردازش کنند و همچنین بتوانند آیتمهای جدیدی که مورد علاقه کاربران واقع شده است را شناسایی کنند و با استفاده از این کاوش سرویسهای جدید را به منظور رقابت با رقبا ارائه میدهد و همچنین مقاله [10,11]است که در آن از کاوش ایده به منظور نوآوری در محصول و توسعه و تحقیق درباره محصول جدید با استفاده از کاوش متنهای اینترنتی که بیانگر نیازهای مصرفکنندگان است استفاده میکند و علاوه بر آن از روش کاوش ایده به منظور کاوش وب[8] برای پیدا کردن مشتریان و شرکتهای سودآور استفاده میکند. [1]Idea mining[2] Text mining[3] Unstructured text[4]Jaccards coefficient[5]Expert systems[6]Knowledge acquisition[7]knowledge-engineering process[8] Web mining