generic-library/vpx

Author	SHA1	Message	Date
Dmitry Kovalev	fc3c3303f1	Removing dummy assignments. Change-Id: I10d1a4bcac751a982d9dd135f019e3a4d92f8522	2013-11-26 15:35:11 -08:00
Dmitry Kovalev	f4bf712fbb	Moving mode encodings from common to encoder + cleanup. Change-Id: I248ccb1532e2cd95314d0b95108f2c2e71cf084f	2013-11-26 14:53:17 -08:00
Yaowu Xu	b60293e1ce	Merge "Amended some comments for clarity"	2013-11-26 14:32:02 -08:00
Frank Galligan	b4874e2c82	Fix 16 wide neon horz loopfilter. Multiply by 3 was on 8bit vectors when it should have been on 16bit vectors. Change-Id: I248c1429b3134dfd171dfab0ebb109fd2437e1fc	2013-11-26 10:02:40 -08:00
Yunqing Wang	7a5fd6a1bf	Merge "Do vertical loopfiltering in parallel"	2013-11-26 09:35:14 -08:00
Abo Talib Mahfoodh	f97d91ab67	improve vp9_idct32x32_34(x1.472)&1024(x1.032)_add_sse2 vp9_idct32x32_34_add_sse2: speedup: 1.472 IDCT32_1D_34 and MULTIPLICATION_AND_ADD_2 are optimized based on the fact that Only upper-left 8x8 has non-zero values. vp9_idct32x32_1024_add_sse2: speedup: 1.032 Tested with: park_joy_420_720p50.y4m Change-Id: I8670ce547552b48695049de298e2fc46ce28dfbc	2013-11-26 12:28:26 -05:00
Dmitry Kovalev	5488da280d	Merge "Moving mv entropy encodings calculation to the encoder side."	2013-11-25 19:15:21 -08:00
Dmitry Kovalev	56d048c412	Moving mv entropy encodings calculation to the encoder side. Moved arrays: vp9_mv_joint_encodings vp9_mv_class_encodings vp9_mv_class0_encodings vp9_mv_fp_encodings Change-Id: Iaf5008c579fcbd6d77fdd81d1aef8c71b5f308b7	2013-11-25 16:36:28 -08:00
Dmitry Kovalev	7ba7a5f817	Merge "Removing redundant call of vp9_init_mbmode_probs()."	2013-11-25 16:08:42 -08:00
Dmitry Kovalev	cfc1f91c9f	Merge "Moving {left, right}_block_mode to vp9_blockd.h."	2013-11-25 10:59:24 -08:00
Dmitry Kovalev	e8af3db88a	Merge "Renaming COMPPREDMODE_TYPE enum and its members."	2013-11-25 10:59:08 -08:00
Yaowu Xu	dd69337e6e	Amended some comments for clarity Change-Id: I31c3908ba394095deb5d3a5d7b7c9b2b5328c3e8	2013-11-25 10:55:01 -08:00
Yaowu Xu	cc1e05ca5f	Merge "In frame Q adjustment experiment."	2013-11-25 10:52:22 -08:00
Jingning Han	f547fb8e07	Merge "Use separate inter predictors for enc/dec"	2013-11-25 10:29:07 -08:00
Paul Wilkins	644bd87e8e	In frame Q adjustment experiment. The idea here is to allow "in frame" adjustment of the final Q value used to encode each SB64, using segmentation. There is also adjustment of the rd mult in regions of overspend. Activated using aq_mode=2 Change-Id: I2f140cd898c9f877c32cd6d2e667f5e11ada4b1c	2013-11-25 10:22:55 -08:00
Yaowu Xu	3183135dd3	Merge "Fix a build issue with visual c."	2013-11-25 10:20:53 -08:00
Jingning Han	ba8b5e8d6d	Use separate inter predictors for enc/dec The decoder will construct inter predictor using lazy border extension, while the encoder, going with multiple runs of motion search in the rate- distortion optimization loop for each block, does border extension at frame level. This commit makes separate the inter predictors for encoder and decoder, respectively. Change-Id: Ieca2fecba3a7201a6d64ef9f219e5d91e50559c3	2013-11-25 09:43:34 -08:00
Jingning Han	12e5ec6aa8	Merge "Separate setup_scale_factor/extend_frame_borders"	2013-11-25 09:14:46 -08:00
Yaowu Xu	86368faca9	Fix a build issue with visual c. Change-Id: Ic8fc16ee1734cfde0d12a2e3abb3e9299382f3b1	2013-11-25 08:11:35 -08:00
Dmitry Kovalev	9fe88870c5	Merge "Cleaning up vp9_append_sub8x8_mvs_for_idx."	2013-11-24 16:08:20 -08:00
Dmitry Kovalev	52b43a2876	Inlining and removing vp9_set_pred_flag_seg_id() function. Change-Id: I0fd76937e847f78378a7ab3fa0af00a7c2c52b42	2013-11-22 17:32:11 -08:00
Dmitry Kovalev	fb9c19c62d	Renaming COMPPREDMODE_TYPE enum and its members. List of renames: COMPPREDMODE_TYPE => REFERENCE_MODE SINGLE_PREDICTION_ONLY => SINGLE_REFERENCE COMP_PREDICTION_ONLY => COMPOUND_REFERENCE HYBRID_PREDICTION => REFERENCE_MODE_SELECT (like TX_MODE_SELECT) NB_PREDICTION_TYPES => REFERENCE_MODES Change-Id: If723dabe9435325d0165dcd028142a2c78b417b4	2013-11-22 16:35:37 -08:00
Dmitry Kovalev	350731e8f9	Organizing all scan tables into lookup table. Change-Id: Ie829ee58a55157e6972c63cebe69a5d0a3221349	2013-11-22 16:20:45 -08:00
Dmitry Kovalev	52fa10a9a3	Cleaning up vp9_append_sub8x8_mvs_for_idx. Change-Id: Ic92f15d82ff5cfa3df655d08e460335c2ef8a325	2013-11-22 15:28:32 -08:00
Jingning Han	86d2a9b978	Separate setup_scale_factor/extend_frame_borders This commit takes out vp9_extend_frame_borders from vp9_setup_scale_factors. The refactoring is for the preparation of the use of lazy border extension at decoder. This makes it necessary to handle border extension separately at encoder/decoder. The use of vp9_extend_frame_borders will be removed, when lazy border extension is ready. Change-Id: Ia3baba3d179d5f11eee1634f19b3b319d2a59186	2013-11-22 12:02:08 -08:00
Dmitry Kovalev	e0ec61187e	Merge "Removing txfrm_block_to_raster_xy() call from extend_for_intra()."	2013-11-22 10:51:38 -08:00
Yunqing Wang	ed36720b66	Do vertical loopfiltering in parallel This patch followed "Add filter_selectively_vert_row2 to enable parallel loopfiltering" commit, and added x86 SSE2 optimization to do 16-pixel filtering in parallel. For other optimizations (neon and dspr2), current 16-pixel functions were done by calling 8-pixel functions twice, and real 16-pixel functions could be added later. Decoder speedup: tulip clip: 2% speed gain; old_town_cross: 1.2% speed gain; bus: 2% speed gain. Change-Id: I4818a0c72f84b34f5fe678e496cf4a10238574b7	2013-11-22 10:04:51 -08:00
Dmitry Kovalev	7c8cac3c21	Removing txfrm_block_to_raster_xy() call from extend_for_intra(). Change-Id: I6a48d1f35ed5fe7a2c7499675b339994c9c3bdf2	2013-11-21 19:30:58 -08:00
Dmitry Kovalev	ad3333e2cd	Merge "Removing plane_block_{width, height} functions."	2013-11-21 16:37:27 -08:00
levytamar82	8def766de2	vp9_short_fdct32x32_rd vp9_short_fdct32x32 optimized for AVX2 Change-Id: I6366e84490883b72362f762369d7e5bccb64f02f	2013-11-21 14:19:49 -08:00
Frank Galligan	97d1258375	Revert "Add 16 wide neon horz loopfilter." The change caused mismatches with some test vectors on neon. Original CL: https://gerrit.chromium.org/gerrit/#/c/67863/ Change-Id: I913891636d53783e93cb1865ca78ded1821dc4b0	2013-11-21 14:01:33 -08:00
Dmitry Kovalev	4896d5c7ef	Moving {left, right}_block_mode to vp9_blockd.h. Both functions have no relation to motion vectors, so moving them from vp9_findnearmv.h to vp9_blockd.h. Change-Id: I74f524267886ab0fff4a2da793a10c906ed0f43a	2013-11-21 11:43:53 -08:00
Yunqing Wang	e002bb99a8	Merge "Add filter_selectively_vert_row2 to enable parallel loopfiltering"	2013-11-21 11:25:55 -08:00
hkuang	370bf116a2	Merge "Remove unnecessary eob checking."	2013-11-21 11:24:02 -08:00
Frank Galligan	2dd77580c0	Merge "Add 16 wide neon horz loopfilter."	2013-11-21 10:29:30 -08:00
Yunqing Wang	b5e6d6cccf	Add filter_selectively_vert_row2 to enable parallel loopfiltering Added filter_selectively_vert_row2 to be ready for parallel loopfiltering in vertical direction. This change did 2-row filtering at a time. If 2 vertically adjacent 8x8 blocks do same type of filtering, we can do 16-pixel filtering in parallel. Next, we need to provide 16-pixel loopfiltering functions in c and optimized versions for codec speedup. Change-Id: Idf97bbdd70566e55bd30e1fd25cb8544e33291be	2013-11-21 09:53:15 -08:00
Yunqing Wang	6c4964602a	Merge "Correct ssse3 8/16-pixel wide sub-pixel filter calculation"	2013-11-21 09:40:02 -08:00
Frank Galligan	98de15137e	Add 16 wide neon horz loopfilter. Add support to do 16 pixel horizontal filtering in Neon. Nexus devices saw about 0.5% decode speed increase. Change-Id: I2993f6c2d49f31fa74976879eeaa289fd3f4e15d	2013-11-21 09:39:36 -08:00
Dmitry Kovalev	c90b6bb101	Removing redundant call of vp9_init_mbmode_probs(). This function is called from vp9_setup_past_independence() which is called before the modified piece of code. Moving reset of inter_mode_probs into vp9_init_mbmode_probs() for consistency. Change-Id: Ib188e8798e1fbe15407fd501406761b746fdda95	2013-11-20 21:56:38 -08:00
Dmitry Kovalev	a218a96784	Merge "Adding MV_FP_SIZE constant."	2013-11-20 14:39:58 -08:00
Yunqing Wang	256cf7ee7d	Correct ssse3 8/16-pixel wide sub-pixel filter calculation Although no mismatch was indicated for 8/16 wide sub-pixel filters in issue 661, they had similar problems that could cause mismatch potentially. This patch fixed calculations in HORIZx8/16 and VERTx8/16. Change-Id: I169961c9d40a20340995b7d22aafc89ccf30bfca	2013-11-20 12:52:56 -08:00
Dmitry Kovalev	79b5a2b142	Removing plane_block_{width, height} functions. Change-Id: I29c0dfcf41a1253d5e2a0d2ff740c0c38ebaa5a2	2013-11-20 12:39:29 -08:00
Jim Bankoski	302c33e49f	Merge "Clean up removal of vp9_pareto8 table."	2013-11-20 12:30:03 -08:00
Dmitry Kovalev	4956fcd31b	Adding MV_FP_SIZE constant. Change-Id: I98d750ee92ff51fb714980418ea28be3b1d0f3c6	2013-11-20 12:07:57 -08:00
hkuang	6debc446e0	Remove unnecessary eob checking. Change-Id: Ia568f70bddc1a2b62141a0197459119ca74c22b5	2013-11-20 11:58:11 -08:00
Jim Bankoski	25aae73a30	Merge "remove the model and copy in pack_mb_tokens"	2013-11-20 11:34:30 -08:00
Jim Bankoski	5bbb0c6295	Clean up removal of vp9_pareto8 table. Change-Id: I5556e8d1fc150be8a3e93af21900829b59a500dc	2013-11-20 11:17:26 -08:00
Jingning Han	81b9fd4310	Merge "Take out assertion from inverse transforms"	2013-11-20 10:55:27 -08:00
Jim Bankoski	03276bf6e6	remove the model and copy in pack_mb_tokens Change-Id: I00a5203c8ed76c184d936fccf93d76e7c06773d3	2013-11-20 10:06:04 -08:00
Yunqing Wang	0ef63f596d	Fix stack pointer in sub-pixel filters In commit "3d50da5397d20abc932d81453b26cde758293a40", the stack pointer was modified while aligning the stack, and it needed to be pop out at the end. Change-Id: I062971e195f1f2ab9d0ab5fb84dcf215a0fcaa67	2013-11-20 09:42:44 -08:00
Guillaume Martres	b00057c88a	Merge "vpxenc: add --aq-mode flag to control adaptive quantization"	2013-11-20 08:13:28 -08:00
Jim Bankoski	7a8a68e2bd	Merge "scan order table lookup same for encoder and decoder"	2013-11-19 16:22:48 -08:00
Yunqing Wang	e8f8e77642	Merge "Fix decoder mismatch with ssse3 enabled"	2013-11-19 16:19:32 -08:00
Yaowu Xu	dd04ff506b	Merge "Move vp9_setup_interp_filter() to encoder"	2013-11-19 16:01:19 -08:00
Jim Bankoski	d6667dd54f	scan order table lookup same for encoder and decoder Change-Id: I473947b5ca70b7a81151926284bff86f8555492a	2013-11-19 15:31:43 -08:00
Yunqing Wang	3d50da5397	Fix decoder mismatch with ssse3 enabled This patch fixed issue 661: "Decoder produces mismatched outputs with ssse3 enabled and disabled." In sub-pixel filters, a pixel value was multiplied by a filter coefficient, and the results were added up. The order of adding up these multiplications had to be arranged carefully to prevent incorrect overflowing. Change-Id: Id08af4200fea9e1b896fc40157b8651c2c7e80f2	2013-11-19 15:10:04 -08:00
Dmitry Kovalev	65cee2f01a	Merge "Simplifying partition context calculation."	2013-11-19 15:09:01 -08:00
Jim Bankoski	60aba6558f	Merge "entropy code speedup"	2013-11-19 14:58:44 -08:00
Yaowu Xu	df78fea166	Move vp9_setup_interp_filter() to encoder As it is used in encoder only. Change-Id: I5f2a8abbe72bb18cbf6ce36a3dc7e132aeae8ec2	2013-11-19 14:57:58 -08:00
Yaowu Xu	f92cfa1ca6	Merge "Move vp9_sadmxn.h from common to encoder"	2013-11-19 14:41:33 -08:00
Jim Bankoski	8cf352abac	entropy code speedup Change-Id: Ic316d3374ff9a2b43897272260947d56765a0fdd	2013-11-19 14:31:38 -08:00
Jim Bankoski	ff4f1c4b76	scan order / neighbors converted to lookup Change-Id: I64b189dfeee1cf3e90134a1a93497072f3361e5e	2013-11-19 12:55:44 -08:00
Yaowu Xu	30b03050a2	Move vp9_sadmxn.h from common to encoder Change-Id: I6f6ba91b1b8b280902b171472314d665aa0baf0b	2013-11-19 12:46:08 -08:00
Dmitry Kovalev	f6ec323906	Simplifying partition context calculation. Reversing bit order of partition_context_lookup, and modifying accordingly update_partition_context() and partition_plane_context(). Change-Id: I64a11f1a94962a3bf217de2f50698cb781db71a5	2013-11-19 11:17:30 -08:00
Yunqing Wang	f16fb829e6	Merge "Improve vp9_iht4x4_16_add_sse2 (x1.341)"	2013-11-19 11:11:47 -08:00
Dmitry Kovalev	953b1e9683	Removing raster_block_offset_uint8() function. There is no need to use that function, it is much clear to pass offset directly to the buffer. Change-Id: I9026cb0c5094c46f97df5d7f7daeb952f2843b24	2013-11-18 19:00:49 -08:00
Dmitry Kovalev	9e1e7bee48	Merge "Finally removing txfrm_block_to_raster_block() function."	2013-11-18 18:43:16 -08:00
Dmitry Kovalev	220af9ac2c	Merge "Cleaning up vp9_entropy.c file."	2013-11-18 18:04:56 -08:00
Abo Talib Mahfoodh	613e2d2e90	Improve vp9_iht4x4_16_add_sse2 (x1.341) This rebase is a better implementation of the previous ones. Modifications are done to reduce the total clock cycle. Speedup: 1.341 Compiled with -O3 Tested with: park_joy_420_720p50.y4m Change-Id: I940eaf283f60597ca0d9d2e13d518878d55ff02d	2013-11-18 20:53:13 -05:00
Dmitry Kovalev	d8c06d23da	Cleaning up vp9_entropy.c file. Change-Id: I568f5e2d4ef2f2affe013ba1691ffb546f1fe8c6	2013-11-18 17:18:14 -08:00
Yaowu Xu	a42ab027fd	Merge "Move vp9_extend.{h,c} from common to encoder"	2013-11-18 15:43:32 -08:00
Yaowu Xu	1c61e1960d	Move vp9_extend.{h,c} from common to encoder Since they used in encoder only. This commit also re-order includes for the files that include vp9_extend.h Change-Id: I929fc113f2135d3198cd1fc6a17434e5a2f8a459	2013-11-18 12:43:36 -08:00
Yunqing Wang	e3168b0c54	Merge "Do horizontal loopfiltering in parallel"	2013-11-18 10:03:41 -08:00
Jim Bankoski	83eb1975df	partition context update speedup This removes a lot of operations in setting partition context... Change-Id: I365e6f5607ece85190cb21443988816dfa510ce3	2013-11-17 06:58:08 -08:00
Yunqing Wang	64f728caef	Do horizontal loopfiltering in parallel This patch followed "Rewrite filter_selectively_horiz for parallel loopfiltering" commit, and added x86 SSE2 optimization to do 16-pixel filtering in parallel. Also, corrected the declaration of aligned arrays. For 8-pixel-in-parallel case, improved the calculation of the masks and filters. Updated the threshold loading since the thresholds were already duplicated. Updated neon C functions to call neon loopfilters twice. Using tulip clip, tests showed it gave a ~1.5% decoder speed gain. Change-Id: Id02638626ac27a4b0e0b09d71792a24c0499bd35	2013-11-15 16:18:43 -08:00
Jingning Han	bdc4371174	Take out assertion from inverse transforms Separate the rounding and right shift operations of forward transform from those of inverse transform. Take out the assertion check from inverse transforms. If the transform coefficients were constructed to cause intermediate steps of inverse transform overflow, the codec will just let it overflow without breaking the decoding flow. Change-Id: I73cfc3706c4e840fc543a77cbc4cdb0b05d07730	2013-11-15 15:30:47 -08:00
hkuang	7424492a0b	Let the idct vp9_idct32x32_34_add = vp9_idct32x32_1024_add on arm until we implenment real vp9_idct32x32_34_add_neon. This issue is due to commit `47665452f0` Merge "Add 32x32 idct function for eob<=34 case". Change-Id: I56b5f0abc20e7dd1bba521f78a995e85d65ea296	2013-11-15 14:59:16 -08:00
Guillaume Martres	17084657e6	vpxenc: add --aq-mode flag to control adaptive quantization Change-Id: I57e1ad4bed3487df12893ced77c49093f8755706	2013-11-15 19:42:20 +01:00
Dmitry Kovalev	8d7bd4d126	Merge "Cleaning up vp9_loopfilter.c file."	2013-11-15 10:10:59 -08:00
Jingning Han	a9b9f22bcd	Merge "Fix coding format in vp9_idct"	2013-11-15 08:59:14 -08:00
Jim Bankoski	e1b6c42eed	partition plane context speed up Removes silly operations inside loop. Change-Id: I9eeab1e914e715a887f86cf1089de508e2364165	2013-11-15 08:00:43 -08:00
Jim Bankoski	ffb17e2c09	Merge "loop filter assert cleanout"	2013-11-15 07:48:36 -08:00
Dmitry Kovalev	38e6cb8c7b	Merge "Cleaning up vp9_tile_common.{h, c} files."	2013-11-14 20:55:01 -08:00
Jingning Han	7637387cf1	Fix coding format in vp9_idct Change-Id: If97ae16a4478717933345b6b9d5bc1b417b8dd84	2013-11-14 16:05:22 -08:00
Adrian Grange	38144ed8b2	fix scalling bug by buffer auto-reallocation Change-Id: Ib748eb287520c794631697204da6ebe19523ce95	2013-11-14 15:53:09 -08:00
Dmitry Kovalev	3f9fc6f6f8	Cleaning up vp9_loopfilter.c file. Change-Id: Ic6770072f80dfb54d2725ed96370d4f243a9f474	2013-11-14 15:04:14 -08:00
Dmitry Kovalev	49fbbf72fa	Finally removing txfrm_block_to_raster_block() function. We only use txfrm_block_to_raster_xy() now. Change-Id: I4242cd592da99e761041acf9fef1bac3d55a48e1	2013-11-14 13:45:51 -08:00
Dmitry Kovalev	f91ac9b436	Cleaning up vp9_tile_common.{h, c} files. Change-Id: I9d18f351abe7614107f34f47eeb38a234a9937c9	2013-11-14 13:40:56 -08:00
Jim Bankoski	ef99b7b884	loop filter assert cleanout Change-Id: I4e2ad4b7342681e6ac236356ef3a4927a54f105b	2013-11-14 12:25:32 -08:00
Deb Mukherjee	cfcd5c4f61	Simplifies band-getting with a static array Simplifies the code by implementing band mapping with static arrays. A lot of the code complexity introduced in a previous patch disappears. Change-Id: Ia3fac36e594fb5ad2d55ae141c58bba4c55c2d28	2013-11-13 22:15:16 -08:00
Dmitry Kovalev	26a1ad604f	Merge "Removing function pointers from inter prediction."	2013-11-13 13:54:15 -08:00
Dmitry Kovalev	60d1a52995	Merge "Optimizing set_contexts() function."	2013-11-13 10:01:05 -08:00
Yunqing Wang	8ce0967df8	Merge "Use 1D array to store super block filter levels"	2013-11-13 09:40:14 -08:00
Johann	4da2a8b718	Merge "mips dsp-ase r2 vp9 decoder intra module optimizations (rebase)"	2013-11-13 09:00:09 -08:00
Parag Salasakar	1530a6b77f	mips dsp-ase r2 vp9 decoder intra module optimizations (rebase) Change-Id: Ib27fc4f3dbe01fe8adfa04a61aaba21b3480e75c	2013-11-13 11:17:14 +05:30
Parag Salasakar	248cf6f69f	mips dsp-ase r2 vp9 decoder loopfilter module optimizations (rebase) Change-Id: Ia7f640ca395e8deaac5986f19d11ab18d85eec2d	2013-11-13 10:53:16 +05:30
Dmitry Kovalev	3f3d14e1d3	Moving q_index from MACROBLOCKD to MACROBLOCK. Moving because q_index is used only by encoder. Change-Id: I0b96175614ed4fd3d76ee56a0ba36258e1e896f6	2013-11-12 18:13:19 -08:00
Dmitry Kovalev	73a5cbeba4	Merge "Using max_tx_size instead of bsize when possible."	2013-11-12 16:54:30 -08:00
Dmitry Kovalev	3a2ea76469	Merge "Moving {sb, mb, b, ab}_index from MACROBLOCKD to MACROBLOCK."	2013-11-12 15:59:28 -08:00
Dmitry Kovalev	58b004ff64	Merge "Adding const to tree pointer inside vp9_extra_bit struct."	2013-11-12 15:48:07 -08:00
Johann	8dd3905163	Merge "Added optimized vp9_idct32x32_34_add_dspr2"	2013-11-12 15:30:00 -08:00
Dmitry Kovalev	20f34ff0db	Adding const to tree pointer inside vp9_extra_bit struct. Change-Id: I60e02fa3de930ff1f969687ab5af93dee40d86ad	2013-11-12 14:21:15 -08:00
Yunqing Wang	ce89309b45	Use 1D array to store super block filter levels As Jim suggested, 1D array was used to store filter levels instead of 2D array. This used shift_y in setup_mask directly, and saved few cycles. Change-Id: If61ab298784861f1806b1cd396d4e4e2e0f097b9	2013-11-12 12:07:57 -08:00
Deb Mukherjee	a33a84b11a	Merge "Removes conditional statements from band getting"	2013-11-12 11:22:21 -08:00
Johann	e72d49a97a	Use lowercase 'b' to branch iOS doesn't recognize B: bad instruction `B idct32_pass_loop' Change-Id: I3cf6aede4639f1d9efa97f7962fa287ba6feaaef	2013-11-12 10:41:06 -08:00
Yunqing Wang	17322275dd	Merge "Rewrite filter_selectively_horiz for parallel loopfiltering"	2013-11-12 10:20:49 -08:00
Yunqing Wang	7989768766	Merge "Improve loopfilter function"	2013-11-12 10:19:56 -08:00
Deb Mukherjee	5ade423774	Removes conditional statements from band getting Implements scan order to band map with arrays in both the encoder and decoder to remove conditional statements. Encoding seems to be about 1% faster at speed 0, tested on football. Decoding seems to be about 0.5-1% faster on a set of 25 videos. Change-Id: Idb233ca0b9e0efd790e30880642e8717e1c5c8dd	2013-11-12 10:13:27 -08:00
Dmitry Kovalev	50f97cf7fb	Removing function pointers from inter prediction. Removing foreach_predicted_block_visitor and calling build_inter_predictors directly. Change-Id: I11bb3c872b99b47c2680b01b0dbcc01c558c4a2b	2013-11-11 18:37:00 -08:00
Yunqing Wang	b45438181c	Rewrite filter_selectively_horiz for parallel loopfiltering Added loop filter mask checking, and made the caller function ready for implementation of parallel loopfiltering in horizontal direction. Next, we need to go through the loopfilter functions (both c and optimized versions), and provide 16-byte wide loopfiltering for each filter type. Change-Id: Ifef47e7ef9086ebc2fd6ca7ede8f27c9bbf79e66	2013-11-11 17:06:01 -08:00
Dmitry Kovalev	3551e25099	Moving {sb, mb, b, ab}_index from MACROBLOCKD to MACROBLOCK. We use {sb, mb, b, ab}_index only inside encoder, so moving them into appropriate data structure. Change-Id: Ib5c1036716354d9d321e11a60c1634c1cb8f9716	2013-11-11 15:58:57 -08:00
Jingning Han	d8b4c79270	Decouple macroblockd_plane buffer usage Make the macroblockd_plane contain dynamic buffer pointers instead static pointers to the memory space allocated therein. The decoder uses the buffer allocated in pbi, while encoder will use a dual buffer approach for rate-distortion optimization search. Change-Id: Ie6f24be2dcda35df7c15b4014e5ccf236fb3f76c	2013-11-11 15:26:10 -08:00
hkuang	c689a126ed	Fix a bug in the assembly code. Change-Id: Ic416e3f8a11e82ee298e6f709b2119a9ddf1e2f8	2013-11-11 12:49:12 -08:00
Dmitry Kovalev	c53a9c70fb	Merge "Localizing NEARESTMV special cases in the code."	2013-11-11 11:12:06 -08:00
Dmitry Kovalev	22a001988b	Optimizing set_contexts() function. Inlining set_contexts_on_border() into set_contexts(). The only difference is the additional check that "has_eob != 0" in addition to "xd->mb_to_right_edge < 0" and "xd->mb_to_right_edge < 0". If has_eob == 0 then memset does the right thing and works faster. Change-Id: I5206f767d729f758b14c667592b7034df4837d0e	2013-11-08 12:44:56 -08:00
Yunqing Wang	e731b2ba2c	Merge "Improve vp9_idct4x4_1_add_sse2"	2013-11-08 12:00:36 -08:00
Yunqing Wang	49cf335e7f	Improve loopfilter function This patch continued the work done in "Rewrite loop_filter_info_n struct"(commit:00dbd369c70270428d56da6d15ea5486fc821c52) to further improve loopfilter function. 1. Instead of storing pointers to thresholds, store loopfilter levels within 64x64 SB; 2. Since loopfilter levels are already calculated in setup_mask, we don't need call build_lfi to look up them again. Just save loopfilter levels in setup_mask. 3. Reorganized and simplified filter_block_plane(). Tests showed a ~0.8% decoder speedup. Change-Id: I723c7779738bbc2afcb9afa2c6f78580ee6c3af7	2013-11-08 11:48:31 -08:00
hkuang	a6462990e6	Merge "Add back vp9_short_idct32x32_1_add_neon which is deleted in cleanup I63df79a13cf62aa2c9360a7a26933c100f9ebda3."	2013-11-07 14:42:29 -08:00
Ivan Maltz	741c14fcf0	Merge "Move SVC per-frame loop from sample app into libvpx proper"	2013-11-06 17:24:05 -08:00
Ivan Maltz	1ed0e1beb5	Move SVC per-frame loop from sample app into libvpx proper SVC multiple layer per frame encoding is invoked with vpx_svc_init and vpx_svc_encode. These interfaces are designed to be invoked from ffmpeg. Additional improvements: - make dummy frame handling a bit more explicit - fixed bug with single layer encodes - track individual frame sizes and psnrs instead of averages - parameterized quantizer, 16th scalefactors, more logging, - enabled single layer encodes to generate baseline - include new mode for 3 layer I frame with 5 total layers Change-Id: I46cfa600d102e208c6af8acd6132e0cc25cda8d4	2013-11-06 14:49:27 -08:00
Dmitry Kovalev	7b011c5467	Replacing mi_{width,height}_log2 with num_8x8_blocks_{wide,high}_lookup. Change-Id: I04c55daef89bca2b85cb7db0850f9b052abc5a7c	2013-11-06 13:34:23 -08:00
Yaowu Xu	2f4bade348	Merge "Missing _ means no sse3 for vp9_h_predictor_32x32."	2013-11-06 13:04:28 -08:00
Paul Wilkins	0c39318a8b	Missing _ means no sse3 for vp9_h_predictor_32x32. Error in script means vp9_h_predictor_32x32 sse3 version is not enabled. Change-Id: Ia43672740da1ecdfb7fcd420490ef424b04accc4	2013-11-06 13:57:55 +00:00
Dmitry Kovalev	4a96e64dc2	Using max_tx_size instead of bsize when possible. Change-Id: I246364bc4270ca13aefb4bc3445bcf102b3170dc	2013-11-05 17:36:43 -08:00
hkuang	6b16f63332	Add back vp9_short_idct32x32_1_add_neon which is deleted in cleanup I63df79a13cf62aa2c9360a7a26933c100f9ebda3. Change-Id: I034848cf05031618818f7df2e7f9c35102686948	2013-11-05 14:57:32 -08:00
Dmitry Kovalev	815189613b	Localizing NEARESTMV special cases in the code. Removing special case handling from vp9_tree_probs_from_distribution(), tree_merge_probs(), and vp9_tokens_from_tree_offset() functions. Replacing inter_mode_offset() function with macro INTER_OFFSET which is used now for vp9_inter_mode_tree definition. Change-Id: Iff75a1499d460beb949ece543389c8754deaf178	2013-11-05 11:58:57 -08:00
Dmitry Kovalev	c622e1d18f	Unified approach for backward probability update. Replacing update_mode_probs() and adapt_probs() with tree_merge_probs(). Change-Id: I50b2c968d67c9265f5216c700cbeba25fb014654	2013-11-04 16:12:29 -08:00
Dmitry Kovalev	dde8069e57	Splitting partition_probs array into two arrays. We only update partition_probs for inter frames but they are constant for key frames. It is not necessary to have constants inside frame context and copy them every time. This change reduces FRAME_CONTEXT size by at least 48 bytes. Change-Id: If70a53be51043f37fe7d113853217937710932a7	2013-11-04 14:26:16 -08:00
Dmitry Kovalev	dd209fae3a	Merge "Removing 'new' probability calculation from convert_distribution()."	2013-11-04 11:14:58 -08:00
James Zern	152181b25c	Merge "vp9 ssse3 d207_predictor_32x32: add missing GLOBAL()"	2013-11-02 12:25:47 -07:00
James Zern	2d980b803a	vp9 ssse3 d207_predictor_32x32: add missing GLOBAL() removes a textrel for sh_b23456789abcdefff Change-Id: I80cb9dfd8e49a0fe884c8ff76472275b3a00cb57	2013-11-01 20:33:22 -07:00
Dmitry Kovalev	df19c6b64c	Removing 'new' probability calculation from convert_distribution(). We don't have to calculate 'new' probability in convert_distribution() because it is enough to calculate only 'new' counters which could be used to calculate probability if necessary. That's why removing a lot of unused temporary probability arrays and reducing number of get_binary_prob() calls. Change-Id: I4e14eb7203d1ace61bbddefd6b9b6326be83ba63	2013-11-01 15:09:43 -07:00
Yaowu Xu	333345cd26	Merge "Convert filter kernel choice to lookup"	2013-11-01 13:43:09 -07:00
Yaowu Xu	0f76ba5523	Convert filter kernel choice to lookup Also removed unused declaration related 6 tap filter Change-Id: Ic17f516141d885157918505f4204081e4c951fad	2013-11-01 13:03:18 -07:00
Dmitry Kovalev	340b2b076e	Merge "Cleanup. Adding const to function pointer arguments."	2013-11-01 10:57:03 -07:00
Dmitry Kovalev	0e1756330b	Merge "Removing is_intra_mode() function."	2013-10-31 18:06:53 -07:00
Dmitry Kovalev	7c524bbef4	Cleanup. Adding const to function pointer arguments. Change-Id: I12c67c8c0fa1aa7fb3f7d6cc2ef65be29c4ea292	2013-10-31 14:34:21 -07:00
Yaowu Xu	d515716140	Merge "mb_lpf_horizontal_edge AVX2 optimization"	2013-10-31 10:43:57 -07:00
Yunqing Wang	d03b3cbdd7	Merge "Fix x_offset_q4/y_offset_q4 calculation"	2013-10-31 09:47:54 -07:00
Tamar Levy	54f9205653	mb_lpf_horizontal_edge AVX2 optimization This CL contains two AVX2 optimized loop filter functions, mb_lpf_horizontal_edge_w_avx2_8 and mb_lpf_horizontal_edge_w_avx2_16. Change-Id: I604e4fe6e99752b7800c2ea98721d97f7e0b931b	2013-10-31 10:26:15 -06:00
Parag Salasakar	d5a52edc11	Added optimized vp9_idct32x32_34_add_dspr2 Change-Id: I2ba9467525b87a8e4a58f0c546e63031b4e38a4e	2013-10-31 12:12:34 +05:30
Dmitry Kovalev	6761872e49	Replacing (SWITCHABLE_FILTERS + 1) with SWITCHABLE_FILTER_CONTEXTS. Change-Id: I9781a62bc1a4cd9176554d1271d87dbcafda9cb0	2013-10-30 14:40:34 -07:00
Yunqing Wang	9ed2d0a577	Fix x_offset_q4/y_offset_q4 calculation "<< SUBPEL_BITS" needs to be added in the calculation. Call set_scaled_offsets() to calculate x_offset_q4 and y_offset_q4. Change-Id: Ied130ea771510e918f51cd1dc3abe57f4c0962b5	2013-10-29 17:46:55 -07:00
Dmitry Kovalev	1bea58e4a8	Merge "Adding const to vp9_quantize_b_{32x32,} parameters."	2013-10-29 16:57:52 -07:00
Erik Niemeyer	27b8040c76	Merge "CL for adding AVX-AVX2 support in libvpx."	2013-10-29 15:55:54 -07:00
Dmitry Kovalev	065972f959	Adding const to vp9_quantize_b_{32x32,} parameters. Change-Id: I56f8c50ac382202f66040cd9cfaa05d889572fc7	2013-10-29 15:25:19 -07:00
Erik Niemeyer	e6863ef318	CL for adding AVX-AVX2 support in libvpx. Change-Id: Idc03f3fca4bf2d0afd33631ea1d3caf8fc34ec29	2013-10-29 15:11:16 -07:00
Dmitry Kovalev	e5956258dd	Merge "Making get_tx_counts() similar to get_tx_probs()."	2013-10-29 10:48:50 -07:00
Yunqing Wang	c634ec6a56	Merge "Rewrite loop_filter_info_n struct"	2013-10-29 09:49:36 -07:00
Dmitry Kovalev	aa76cd1e49	Removing is_intra_mode() function. It is enough to check just block type: intra or inter. Intra block implies intra prediction mode, and inter block implies inter mode. Change-Id: I3cf98731a3935f670a3cd8e2b2443483eb944be4	2013-10-28 20:00:55 -07:00
Dmitry Kovalev	fa1ac00aee	Making get_tx_counts() similar to get_tx_probs(). Change-Id: I5b17f40e515c4bcf9ebef5380270a214af4e0115	2013-10-28 19:52:38 -07:00
Dmitry Kovalev	19cf72eddc	Adding {read, write}_partition() instead of check_bsize_coverage(). Making partition read/write logic more clear. Change-Id: I1981e90327257d37095567c62d72a103cda1da33	2013-10-28 15:14:45 -07:00
James Zern	58a0f6dbdd	vp9: add TileInfo replaces use of cur_tile_mi_(row\|col)_(start\|end) by VP9_COMMON, making it less stateful and more reusable for parallel tile decoding Change-Id: I1df09382b4567a0e5f4434825d47c79afe2399be	2013-10-28 20:54:43 +01:00
James Zern	3ffa41aae3	Merge changes If9b16f7d,I75aab21c,I9cbb768c,If5cea3d3,I96940657,I025595d8,Ie0bc3935,I3ebb172d * changes: vp9: remove partition+entropy contexts from common vp9: add above/left_context to MACROBLOCKD vp9: add above/left_seg_context to MACROBLOCKD vp9: add above/left_context to encoder vp9: add above/left_seg_context to encoder vp9: pass entropy context directly to set_skip_context vp9: pass context directly to partition functions vp9/decode: add alloc_tile_storage()	2013-10-28 12:45:11 -07:00
Dmitry Kovalev	ded951793c	Merge "Replacing is_inter_mode with is_inter_block."	2013-10-28 10:07:06 -07:00
James Zern	7b9ca3caa7	vp9: remove partition+entropy contexts from common these are now handled separately by the encoder and decoder Change-Id: If9b16f7d734e992fb94a510a6d88f2690d7fb7cb	2013-10-28 11:34:20 +01:00
James Zern	e571d3badc	vp9: add above/left_context to MACROBLOCKD Change-Id: I75aab21c1692cbad717564cbb436578fddbc348d	2013-10-28 11:34:18 +01:00
James Zern	d9a317c8b2	vp9: add above/left_seg_context to MACROBLOCKD Change-Id: I9cbb768c5f857a096cf6c29d6755d0e5e6728435	2013-10-28 11:32:16 +01:00
Dmitry Kovalev	07502f1963	Merge "Adding get_frame_new_buffer() function to replace duplicated code."	2013-10-25 15:25:13 -07:00
Dmitry Kovalev	ddfc87c6f3	Merge "Making input pointer constant for all fdct/fht functions."	2013-10-25 15:14:49 -07:00
Yunqing Wang	00dbd369c7	Rewrite loop_filter_info_n struct Restructured the storing of loopfilter information. Deleted loop_filter_info struct and reduced copying happened in every superblock. Tests showed a 0.5% ~ 0.8% decoder speed gain. Change-Id: Ie6a8e46bae71dc3a3cd8c6054f5de540b8e0ef5e	2013-10-25 14:56:28 -07:00
James Zern	d2bf696ee0	vp9: pass entropy context directly to set_skip_context this will allow for separate storage to be used in tile decoding Change-Id: I025595d83118bdc82a545dae69bc6602e8d2a6e3	2013-10-25 22:01:13 +02:00
James Zern	88d79eabdc	vp9: pass context directly to partition functions update_partition_context / partition_plane_context: this will allow for separate storage to be used in tile decoding Change-Id: Ie0bc393531ab7e9d2ce35c95111849b294aad4ed	2013-10-25 22:01:13 +02:00
Dmitry Kovalev	d5ac877f7f	Adding COLOR_SPACE enum. Change-Id: If5711eb166609cce0a88b3cb5b56b3afeebc4fb0	2013-10-25 12:35:20 -07:00
Yunqing Wang	47665452f0	Merge "Add 32x32 idct function for eob<=34 case"	2013-10-25 09:34:46 -07:00
Yunqing Wang	f88315cb29	Add 32x32 idct function for eob<=34 case When only upper-left 8x8 area has non-zero dct coefficients, we could skip 1D IDCT for 9th to 32th rows to save operations. This function is called when eob <= 34. Change-Id: I9684b75947bdde346cfe3720f08a953aa7a13fb5	2013-10-24 16:13:21 -07:00
Johann	35c4437bf5	Merge "mips dsp-ase r2 vp9 decoder idct module optimizations (rebase)"	2013-10-24 15:49:31 -07:00
Dmitry Kovalev	237ce8724a	Adding get_frame_new_buffer() function to replace duplicated code. Change-Id: I6e0e19231a48364c1de7dfab730b121ab227f111	2013-10-24 12:20:35 -07:00
Dmitry Kovalev	600a3860a4	Making input pointer constant for all fdct/fht functions. Change-Id: I78f7012f967a777ddd39bae6671eb501df6bbfe8	2013-10-24 11:48:25 -07:00
Dmitry Kovalev	7bb48e5e8e	Replacing is_inter_mode with is_inter_block. It should be only a check based on the block type (inter vs intra), not on the mode value. Change-Id: I0378cb4ba7c9a1631c1e870a537187b8650fa30a	2013-10-24 11:22:06 -07:00
Dmitry Kovalev	dfc7945d1e	Adding get_frame_ref_buffer() function + cleanup. Change-Id: Ib9ead216fc54b2df6f6f1fe82d2ea137197beebd	2013-10-24 11:05:35 -07:00
Dmitry Kovalev	8001ed71ed	Merge "Renaming vp9_short_fdct4x4 and vp9_short_walsh4x4."	2013-10-24 10:08:42 -07:00
Dmitry Kovalev	710ca1fe36	Merge changes I1868fb75,I9ff504c6 * changes: Renaming INTERPOLATIONFILTERTYPE to INTERPOLATION_TYPE. Adding VP9_FRAME_MARKER constant.	2013-10-24 10:08:19 -07:00
Dmitry Kovalev	153d70ca9b	Merge "Cleaning up {above, left}_block_mode functions."	2013-10-24 10:07:51 -07:00
Yunqing Wang	93ec31dff6	Merge "Improve scale_factors struct"	2013-10-24 09:13:41 -07:00
James Zern	eec622d178	Merge "vp9/extend_for_intra: avoid crossing tile boundary"	2013-10-24 06:04:10 -07:00
James Zern	3c038b6c40	vp9/extend_for_intra: avoid crossing tile boundary Change-Id: I0d8a71778aa3c73b8b1673e14053074bb866548b	2013-10-24 14:21:24 +02:00
Parag Salasakar	1699eb0bf6	mips dsp-ase r2 vp9 decoder idct module optimizations (rebase) Change-Id: Iedcdb8867084f328f4fce2fadb968e0984217308	2013-10-24 11:29:04 +05:30
Dmitry Kovalev	5d28b63687	Cleaning up {above, left}_block_mode functions. Making {above, left}_block_mode more clear and symmetric. Change-Id: Ie348a950fb9a5cf52861d0cba838a58010ff56ad	2013-10-23 17:54:13 -07:00
Dmitry Kovalev	ad867fe237	Renaming INTERPOLATIONFILTERTYPE to INTERPOLATION_TYPE. Change-Id: I1868fb75ed88bfa65c1c2ca24677d65f2894d713	2013-10-23 17:45:52 -07:00
Dmitry Kovalev	a53075f7c5	Adding VP9_FRAME_MARKER constant. Also renaming SYNC_CODE_* to VP9_SYNC_CODE_*. Change-Id: I9ff504c6ebce6cd6673d7df2085d597b818f5960	2013-10-23 17:24:17 -07:00
Dmitry Kovalev	fd724f13b0	Renaming vp9_short_fdct4x4 and vp9_short_walsh4x4. For consistency with idct function names. Renames: vp9_short_fdct4x4 -> vp9_fdct4x4 vp9_short_walsh4x4 -> vp9_fwht4x4 Change-Id: Id15497cc1270acca626447d846f0ce9199770f58	2013-10-23 14:28:39 -07:00
Dmitry Kovalev	a018988ce8	Renaming vp9_short_fdct32x32 to vp9_fdct32x32. For consistency with idct function names. Change-Id: Ie77b7178e0894c57cd5cb9243c949eb9224ece18	2013-10-23 13:41:40 -07:00
Dmitry Kovalev	5bdd4d9ccf	Merge "Renaming vp9_short_fdct16x16 to vp9_fdct16x16."	2013-10-23 13:37:09 -07:00
Dmitry Kovalev	a9c8251b9d	Merge "Renaming vp9_short_fdct8x8 to vp9_fdct8x8."	2013-10-23 11:38:55 -07:00
Jingning Han	9cc4935d7b	Merge "Make decode modules independent of tile index"	2013-10-23 11:08:12 -07:00
Dmitry Kovalev	02feb63684	Renaming vp9_short_fdct16x16 to vp9_fdct16x16. For consistency with idct function names. Change-Id: I5ca355ba99fdba04f09254be95cf79808b534f71	2013-10-23 10:57:12 -07:00
Dmitry Kovalev	fa143dbc8e	Renaming vp9_short_fdct8x8 to vp9_fdct8x8. For consistency with idct function names. Change-Id: I7b6af2f92c66eff56f84ed29edc3a66af8dc421f	2013-10-23 10:52:33 -07:00
Dmitry Kovalev	73fe696c91	Merge "Reordering probability tables for consistency."	2013-10-23 10:10:24 -07:00
Adrian Grange	2f58b813bb	Remove right_available member from VP9_COMP This member of VP9_COMP is no longer used, so I removed it. Change-Id: I3509f52756da4768a3e4581cec5ed5d2a70d5fb8	2013-10-22 16:53:37 -07:00
Jingning Han	bd23e084eb	Make decode modules independent of tile index Assign the pointer to mode_info stream per tile. Remove the use of tile_col in the decoding modules. Change-Id: I7df87086708a3d92c5e20e86bcfb04e458ff47a6	2013-10-22 15:22:59 -07:00
Yunqing Wang	175c313a12	Improve scale_factors struct The ref's scale_factors are set at frame level, and then copied for each partition block. Since the struct members are mostly constant, this patch separated the constant and non-constant members, and reduced struct copying. This gave 0.5% ~ 1.4% decoder speed gain. Change-Id: I94043bf5a6995c8042da52e5c661818dfa6f6d4c	2013-10-22 13:10:22 -07:00
Dmitry Kovalev	9f09618bd4	Merge "Using stride (# of elements) instead of pitch (bytes) in fdct4x4."	2013-10-22 13:05:24 -07:00
James Zern	64d94b4aa6	Merge "Revert "Merge "SVC improvements"""	2013-10-22 12:47:22 -07:00
Dmitry Kovalev	68c02593df	Reordering probability tables for consistency. Putting vp9_kf_y_mode_prob[] before vp9_kf_uv_mode_prob[]. Change-Id: I2404910e35de1ee24ce46337e00c07eb1446e50f	2013-10-22 12:21:37 -07:00
Dmitry Kovalev	fa57135b2c	Merge "Removing NUM_ prefix from constant names."	2013-10-22 11:34:28 -07:00
Dmitry Kovalev	a767d10fa5	Merge "Using stride (# of elements) instead of pitch (bytes) in fdct8x8."	2013-10-22 11:34:17 -07:00
Jingning Han	7b54556008	Merge "Prevent left_block_mode stepping into left tile"	2013-10-22 09:37:17 -07:00
Jingning Han	c807949408	Prevent left_block_mode stepping into left tile This commit uses left_available flag to decide if the left mode_info struct is available for left_block_mode. As discussed with James Zern (jzern@), this prevents the codec from fetching mode_info from blocks in the left tile, which although effectively not used might present concerns for multi-threaded tile decoding. This is NOT a bit-stream change. Change-Id: I1dc8cf1bcbf056688eee27c7bc5706ac4b4e0125	2013-10-22 09:02:41 -07:00
Abo Talib Mahfoodh	908a992d7f	Improve vp9_idct4x4_1_add_sse2 Simple modification to reduce number of cycles in the function. Original function number of cycles: 973 Modified function number of cycles: 835 Improvment factor: 1.165 Tested with: park_joy_420_720p50.y4m Change-Id: Ic5857272ea3aafe21d5ef9a69258d78c688f69bd	2013-10-22 09:35:36 -04:00

... 2 3 4 5 6 ...

2029 Commits