Questions tagged «compiler-optimization»

10
මූලද්‍රව්‍ය වශයෙන් එකතු කිරීම් ඒකාබද්ධ ලූපයකට වඩා වෙනම ලූපවල වේගවත් වන්නේ ඇයි?
සිතන්න a1, b1, c1, හා d1ගොඩක් මතක සහ මගේ සංඛ්යාත්මක කේතය කිරීමට අදහස් පහත සඳහන් ප්රධාන පුඩුවක් ඇත. const int n = 100000; for (int j = 0; j < n; j++) { a1[j] += b1[j]; c1[j] += d1[j]; } මෙම ලූපය වෙනත් බාහිර forපුඩුවක් හරහා 10,000 වතාවක් ක්‍රියාත්මක වේ. …

12
GCC විසින් * a * a * a * a * a (a * a * a) * (a * a * a) ප්‍රශස්තිකරණය නොකරන්නේ ඇයි?
මම විද්‍යාත්මක යෙදුමක් මත සංඛ්‍යාත්මක ප්‍රශස්තිකරණයක් කරමි. මා දුටු එක් දෙයක් නම්, GCC විසින් ඇමතුම pow(a,2)සම්පාදනය කිරීමෙන් එය ප්‍රශස්ත කරනු ඇති a*aනමුත් ඇමතුම pow(a,6)ප්‍රශස්තිකරණය කර නොමැති අතර ඇත්ත වශයෙන්ම පුස්තකාල ක්‍රියාකාරිත්වය අමතනු ඇත pow, එමඟින් කාර්ය සාධනය බෙහෙවින් මන්දගාමී වේ. (ඊට වෙනස්ව, ක්‍රියාත්මක කළ හැකි ඉන්ටෙල් සී ++ සම්පාදකයicc පුස්තකාල …

10
32-බිට් ලූප් කවුන්ටරය 64-බිට් සමඟ ප්‍රතිස්ථාපනය කිරීමෙන් ඉන්ටෙල් සීපීයූවල _mm_popcnt_u64 සමඟ පිස්සු කාර්ය සාධන අපගමනය හඳුන්වා දෙයි.
මම popcountවිශාල දත්ත කාණ්ඩයකට වේගවත්ම මාර්ගය සොයමින් සිටියෙමි . මම මුහුණ ඉතා අමුතු සිට පුඩුවක් විචල්ය වෙනස්: ක්රියාත්මක unsignedකිරීමට uint64_tමගේ පළාත් සභා මත 50% කින් කාර්ය සාධනය පහත විය. බෙන්ච්මාර්ක් #include <iostream> #include <chrono> #include <x86intrin.h> int main(int argc, char* argv[]) { using namespace std; if (argc != 2) { …

9
ස්විෆ්ට් බීටා කාර්ය සාධනය: අරා වර්ග කිරීම
මම ස්විෆ්ට් බීටා හි ඇල්ගොරිතමයක් ක්‍රියාත්මක කරමින් සිටියදී එහි ක්‍රියාකාරිත්වය ඉතා දුර්වල බව දුටුවෙමි. ගැඹුරට හාරා බැලීමෙන් පසු මට වැටහී ගියේ එක් බාධකයක් අරා වර්ග කිරීම තරම් සරල දෙයක් බවයි. අදාළ කොටස මෙහි ඇත: let n = 1000000 var x = [Int](repeating: 0, count: n) for i in 0..<n { …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.