Подробнее
5.1. Dataset As we know Deep Neural Networks are data intensive and it performs better if trained with a dataset with large amount of data. As dataset in Bangla language is publicly not available, we collect about 850 Bangla comments from different sources and process them to make them suitable to train the network. Among the comments, 500 comments are positive and the rests are negative. But as the amount of comments is not sufficient to train our proposed network, we just copy-paste the comments repeatedly to increase the size of our dataset. We increase the number of comments in our dataset approximately to 120000. Where 60000 comments are positive and 60000 comments are negative. We divide the positive and negative comments into separate files. To evaluate the model at training period we use 10-fold cross-validation on the training data.
it-юмор,geek,Прикольные гаджеты. Научный, инженерный и айтишный юмор,приколы для образованных даунов со знанием английского,песочница,it humor,geek,pun intended,sandbox
Еще на тему
может в следующем абзаце подробно объяснено, почему так делать не нужно.
আলু — существительное, মাঠ — существительное, জানা — глагол
эх… маловато примеров, говорят, что нужно 120000. Перечитай их 4000 раз.
А теперь проверим твои знания: укажи здесь существительные: মানুষ স্বাধীনভাবে সমান মর্যাদা এবং অধিকার নিয়ে জন্মগ্রহণ করে।