Т.е. мой подход опирается на следующее:
1) Чтение/запись DWORD атомарны (всегда читается/записывается полное значение)
гм, при 16-битной шине и наличии в системе нескольких DMA контроллеров, которые использует ОС ПЛК по своим неизвестным нам приоритетам... ну - ну

а идея, под которую затачивались ПРУ ядра - это остановить ядро, загрузить блок данных, запустить ядро на обработку и по завершении - остановить вычисления и выгрузить результат