Abstract
Digital world is growing very fast and become more complex in the volume (terabyte to petabyte), variety (structured and un-structured and hybrid), velocity (high speed in growth) in nature. This refers to as ‘Big Data’ that is a global phenomenon. This is typically considered to be a data collection that has grown so large it can’t be effectively managed or exploited using conventional data management tools: e.g., classic relational database management systems (RDBMS) or conventional search engines. To handle this problem, traditional RDBMS are complemented by specifically designed a rich set of alternative DBMS; such as - NoSQL, NewSQL and Search-based systems. This paper motivation is to provide - classification, characteristics and evaluation of NoSQL databases in Big Data Analytics. This report is intended to help users, especially to the organizations to obtain an independent understanding of the strengths and weaknesses of various NoSQL database approaches to supporting applications that process huge volumes of data
چکیده
امروزه دنیای دیجیتال با سرعت سریعی در حال رشد بوده و از نظر حجم ذخیره سازی داده ها (ترابایت به پتابایت)، تنوع (ساخت یافته، غیر ساخت یافته و هیبریدی (ترکیبی)، سرعت (سرعت بالای رشد) بسیار پیچیده تر از قبل گشته است. چنین پدیده ای که یک پدیده ی جهانی میباشد، داده های حجیم یا بزرگ نام دارد. این مفهوم عموماٌ شامل یک مجموعه ای از داده ها بوده که با آنچنان رشدی همراه بوده است که نمیتوان آنرا به صورت کارآمد مدیریت کرده و یا با استفاده از ابزار های مدیریتی داده ای مرسوم، آنها را مورد بهره برداری قرار داد: مانند سیستم های مدیریت پایگاه داده های رابطه ای کلاسیک(RDBMS) یا موتور های جستجوی مرسوم. به منظور مدیریت این مسئله، RDBMS های رایج، به وسیله ی طراحی یک مجموعه ی غنی از DBMS های دیگر، مانند NoSQL، NewSQL و سیستم های مبتنی بر جستجو مکمل میگردند. هدف این مقاله این بوده که پایگاه های داده ای NoSQL را به وسیله ی تحلیل داده های حجیم، مورد دسته بندی و ارزیابی قرار داده و مشخصه های آنها را فراهم سازیم. این گزارش به کاربران، مخصوصاٌ سازمان ها، کمک کرده تا یک درک مستقلی از نقاط قوت و ضعف موجود در روش های پایگاه داده ی NoSQL و با هدف پشتیبانی از اپلیکیشن هایی که با حجم زیادی از داده ها رو برو هستند، فراهم سازد.
1-مقدمه
NoSQL که سرواژه ای برای "نه تنها SQL" میباشد، به یک گروه گلچین شده و آشنا از سیستم های مدیریت داده های غیر رابطه ای اطلاق میشود؛ که در آن، این پایگاه داده ها تنها بر مبنای جداول ایجاد نشده اند و عموماٌ از SQL به منظور دستکاری داده ها استفاده نمیکنند[1]. سیستم های مدیریت پایگاه داده ی NoSQL، در صورتی مفید واقع میشوند که با حجم زیادی از داده ها در زمانی که طبیعت داده ها نیازی به مدل رابطه ای ندارد، کار کنیم. سیستم های NoSQL، پایگاه داده هایی توزیع شده و غیر رابطه ای بوده که برای ذخیره سازی داده ها در مقیاس زیاد و برای پردازش داده ها به صورت انبوه و موازی در بین تعداد زیادی از سرور ها طراحی شده اند. این سیستم ها، از زبان ها و مکانیسم های غیرSQL به منظور تعامل برقرار کردن با داده ها (به وسیله ی تعدادی API جدید که پرس و جوهای SQL را به زبان یا ابزار پرس و جوی مختص به سیستم تبدیل میکند) طراحی شده است...