Автор |
Сообщение |
|
Дата: 22 Апр 2014 03:17:37 · Поправил: asv (22 Апр 2014 03:23:27)
#
Если Вам необходим черновой вариант - тогда ориентируйтесь на полосу до 2 МГц, покупайте свисток, учитесь его программировать, далее код на CPU или GPU. Или ищите более продвинутые варианты свистка, ориентированные на Вашу полосу - типа изделий от USRP, HackRF, BladeRF и им подобные. Самому с нуля делать для оценки реализуемости метода/способа/алгоритма приемник прямого преобразования - задача не для всех, мягко говоря.
По поводу производительности. 7 Гфлоп - для GPU на приличной видеокарте это смешно, реально достигается производительность 300 - 500 Гфлоп, при некоторой аккуратности в программировании. Память на бору видеокарты - никак не меньше 1 ГБайта. И осваивается это не в пример быстрее как ЦСП, так и ПЛИС.
Мне кажется, что ваши 7 Гфлоп можно достигнуть и на CPU более-менее современной многоядерной ПЭВМ, наиболее простой путь - использование оптимизированных Intel-овских библиотек, типа MKL.
Это, в отличие от разработки собственной железки, простой путь, быстро приводящий к решению.
|
|
Дата: 22 Апр 2014 11:59:47
#
BladeRF то что нужно, FPGA примитивнейшая штука, ничего сложного в освоении, ИМХО с GPU больше заморочек будет.
|
Реклама Google
|
|
|
Дата: 22 Апр 2014 12:55:07 · Поправил: asv (22 Апр 2014 12:58:41)
#
FPGA примитивнейшая штука, ничего сложного в освоении, ИМХО с GPU больше заморочек будет.
Это, вероятно, на любителя. Любителей ручками делать на ПЛИС, ну например, полноценную поддержку PCI-Express v3.0 x16 я в своей жизни встречал немного. Равно как и любителей отлаживать свои вычислительные алгоритмы непосредственно на железке.
А ежели делать все на готовых IP-core, да еще ограничиваясь стандартными задачами, да еще не пытаясь выжать максимум из ресурса ПЛИС, да еще и не будучи лимитированным сроками - тогда возможно и да.
К слову, поэтому если для NVIDIA Kepler K10 обмен хост-девайс со скоростью немногим более 11 ГБайт/с - это норма, то для известных мне плат сбора данных потолок пропускной способности до хоста - где-то в районе 2.7 ГБайт/с.
|
|
Дата: 22 Апр 2014 13:39:38
#
asv
Равно как и любителей отлаживать свои вычислительные алгоритмы непосредственно на железке.
Алгоритмы с учётом архитектуры вычислителей должны быть отлажены до FPGA на маткаде/матлабе/C..., в железе только перенос и отладка в сравнении с моделями.
|
|
Дата: 29 Апр 2014 07:02:48
#
Если Вам необходим черновой вариант - тогда ориентируйтесь на полосу до 2 МГц, покупайте свисток, учитесь его программировать, далее код на CPU или GPU. Или ищите более продвинутые варианты свистка, ориентированные на Вашу полосу - типа изделий от USRP, HackRF, BladeRF и им подобные. Самому с нуля делать для оценки реализуемости метода/способа/алгоритма приемник прямого преобразования - задача не для всех, мягко говоря.
По поводу производительности. 7 Гфлоп - для GPU на приличной видеокарте это смешно, реально достигается производительность 300 - 500 Гфлоп, при некоторой аккуратности в программировании. Память на бору видеокарты - никак не меньше 1 ГБайта. И осваивается это не в пример быстрее как ЦСП, так и ПЛИС.
Мне кажется, что ваши 7 Гфлоп можно достигнуть и на CPU более-менее современной многоядерной ПЭВМ, наиболее простой путь - использование оптимизированных Intel-овских библиотек, типа MKL.
Мне требуется выполнение 7,2 млн простых математических (сложение, умножение, вычисление корня и т.д.)
TMS3206670- 38.4 GMacs, 19.2 GFlops
Слабовато понимаю GMacs, GFlops- первое операции умножения с накоплением, а второе операции с плавающей точкой.
Можно поподробней и главное проще, чтоб я допедрил что это да как.
Прстые мат. операции (*,/,+ и т.д.) это GFlops?
Извиняюсь за туповатый вопрос.
|
|
Дата: 29 Апр 2014 10:26:47
#
rotor.h1kobra
Поскольку 7,2 млн. операций за 1008 мкс всего 7,2 GMacs (сложение, умножение), то вполне должно хватить.
Операции с плавающей точкой медленнее, поэтому лучше (где можно) переходить в фиксированной точке.
Деление лучше заменить умножение, извлечение квадратного корня - таблицей.
|
|
Дата: 29 Апр 2014 10:59:44
#
ASN
Спасибо!
|
|
Дата: 29 Апр 2014 16:53:40
#
rotor.h1kobra
Не забывайте, что это пиковая производительность при полной загрузке процессора. Как ляжет на него Ваш алгоритм – большой вопрос.
|