Xeon Phi был особенный в этом плане - каждое ядро было все же довольно слабым. Но вообще, если речь об играх то 4, ну может быть 8 потоков это потолок.
Сам работаю на кластере на эпиках: на каждом узле по два 64-ядерных проца, как раз 128 ядер. Все равно чаще упираешься в пропускную способность памяти. В общем у меня неоднозначные чувства по отношению к ним.
Ну в теории и ограничения никакого нет. Но я гонял бенчамрки алгоритмов поиска пути и на 4 потоках получал затык обычно. Просто потому, что алгоритм со случайным доступом в память засрет шину памяти очень быстро. Хорошо, когда запросы идут большие к последовательно расположенным данным и плохо, когда множество мелких по большому объему раскиданных.
Опять же можно сделать скидку на то, что я не спец в этих алгоритмах и структура данных была навязана условиями задачи, да и в играх алгоритмы ищут не точное решение, а приближенное, но все равно поиск пути будет со случайным доступом и потому так или иначе будет ограничивать многопоточность в играх. С физикой или графикой несколько проще, но и там есть свои фишки, большую часть которых я не знаю - потому не могу серьезно рассуждать на эти темы.
Вопрос всегда как сделать. Можно запараллелить на 16+ ядер спокойно, а можно сидеть ползти на одном ядре (привет, стелларис).
Вопрос всегда в цене. Если компания индюшатина и там разрабам вкайф сделать нормально или это какой-нибудь кармак из ID который может пропушить трату х2 времени разработки модуля чтобы получить х1.5 производительности - то да. А если очередные ААА где главное выпустить минимально работоспособную игру чтобы сэкономить и быстрее бабла срубить - тогда и 2 ядра не всегда будут загружены.
Чтобы проц перестал упираться в памяь нужен DDR547, не меньше. Вон простая табличка - доступ в память в 200 раз дороже кэша. То есть вместо того чтобы сделать 200...800 операций проц сидит и ждет пока там данные будут готовы.
Да ничего такого, пытались переносить некоторые многопоточные алгоритмы, в итоге забили, потому что тоже самое с оптимизациями на видеокартах (CUDA) делается проще, быстрее, да и работает лучше.
Ну Intel признали XeonPhi провальным проектом и свернули программу. По их-то заявлениям можно было брать код с OpenMP под обычные процы и запускать на KNL и наслаждаться жизнью. Только реальность несколько иной оказалась...
Тебе лепят минуса за ебанутость, а не суть сказанного. Если раньше у АМД серверный сегмент мягко говоря был жалок то сейчас он вполне достойные решения, которые уже несколько лет в разных ДЦ доступны для массового заказа, а это значит, что они таки востребованы и есть на них клиенты.
Intel анонсировала 10-нм серверные процессоры Xeon Scalable 3-го поколения:
8-40 ядер и рассчитанные на работу в 4- и 8-сокетных системах
т.е. 40*8 = 320 ядер, 640 поток, цена ввп нашей страны...
Ещё один неочевидный вкусный момент EPYC-ов, это что у тебя UMA вместо NUMA и до 128 (а в Zen 4 видимо 256) потоков. Интел так умеет только в NUMA (2+ сокета).
Игры до сих пор полностью i5 семилетней давности не используют) В основном потому, что пиздячит в большей степени видик, а не проц
Так что да, это всё нужно большей частью для серверов и рендера
То что у тебя в мониторинге он не нагружен в соточку не значит, что он не используется полностью - тупо упирается в другую часть. Запусти какую-нить дотку и посмотри мониторинг - там не будет упора в ГПУ.
Нет у меня дотана и качать его специально я не стану
Всякая баттла\хорайзон и иже с ними жрут больше видик, проц грузят даже не наполовину
Стелларис проц жрёт активней
У меня на двухсокетных xeon виртуалка, в целом даже с оверселлом, т.е. ядер на виртуалски роздано больше, чем в друх процессорах. Много ядер не бывает :(
так скажем, не все оптимизируют много поток, ибо не у всех как обычно есть столько потоков, разраб ориентируется на большинство. Нахуя работать больше ради 2%
Сам работаю на кластере на эпиках: на каждом узле по два 64-ядерных проца, как раз 128 ядер. Все равно чаще упираешься в пропускную способность памяти. В общем у меня неоднозначные чувства по отношению к ним.
Опять же можно сделать скидку на то, что я не спец в этих алгоритмах и структура данных была навязана условиями задачи, да и в играх алгоритмы ищут не точное решение, а приближенное, но все равно поиск пути будет со случайным доступом и потому так или иначе будет ограничивать многопоточность в играх. С физикой или графикой несколько проще, но и там есть свои фишки, большую часть которых я не знаю - потому не могу серьезно рассуждать на эти темы.
Вопрос всегда в цене. Если компания индюшатина и там разрабам вкайф сделать нормально или это какой-нибудь кармак из ID который может пропушить трату х2 времени разработки модуля чтобы получить х1.5 производительности - то да. А если очередные ААА где главное выпустить минимально работоспособную игру чтобы сэкономить и быстрее бабла срубить - тогда и 2 ядра не всегда будут загружены.
8-40 ядер и рассчитанные на работу в 4- и 8-сокетных системах
т.е. 40*8 = 320 ядер, 640 поток, цена ввп нашей страны...
Так что да, это всё нужно большей частью для серверов и рендера
Всякая баттла\хорайзон и иже с ними жрут больше видик, проц грузят даже не наполовину
Стелларис проц жрёт активней
2) консоли уже почти 10 лет как 8ядерные
3) даже мобильники за ~$150 сегодня поголовно 8ядерные
2% - как раз про двухядерные огрызки