И еще немного доработал, наверное на этом и остановлюсь пока.
- Добавил небольшую детализацию результатов по отдельным исполняемым потокам.
- Исправил ошибку, вызывающий конфликт при запуске нескольких экземпляров программы.
- Добавил ради интереса тест своих процедур, реализующих арифметику поля Галуа GF(2^8).
- Поменял местами 3-й и 4-й тест, хронологически набор команд SSE2 появился позже.
PS1. Во всех тестах используется 45% операций сложения, 45% умножения и 10% деления.
PS2. Умножение и деление в поле Галуа выполняется с использованием таблиц логарифмов
и степеней, так что на результаты отчасти влияет скорость чтения из процессорного кэша.
Intel Quad Core QX9650 3.0 GHz L2 Cache 12 MB FSB 1333 MHz
ASUS Rampage Extreme X48/ICH9R, 4 x 2 GB DDR3-1333 DRAM
Running 4 threads.
ALU 32-bit int: 2532 MIPS
FPU 80-bit float: 2021 MFLOPS
SSE 4 x 32-bit float: 2702 MVOPS
SSE2 2 x 64-bit float: 2100 MVOPS
Galois Field Operations: 1927 MOPS.
Цитата:
Сообщение от Dikoy
А кому сейчас нужна оптимизация?
|
Кроме Вас, Криса Касперски, меня и еще нескольких воинов дzена наверное уже никому.
Цитата:
Сообщение от Dikoy
Не нравится - покупай комп мощнее
|
Именно так. Только вшивая однопоточная софтина не становится быстрее с ростом коли-
чества ядер / процессоров. А треды, семафоры и мьютексы - это не для слабонервных