generic-library/vpx

Author	SHA1	Message	Date
Yaowu Xu	05e850cb9e	added clamp of segment loop filter level for ABSDATA mode, so segment loop filter level always fall in valid range for both Absolute and delta modes. Change-Id: If90df3411479533dbdab63f8ae088d2f5dd174a9	2014-02-24 09:56:48 -08:00
Yaowu Xu	bfaf415ea7	Merge "Added clamp of qindex to valid range"	2014-02-24 08:28:07 -08:00
Dmitry Kovalev	2aacc66b66	Merge "Cleaning up vp9_mvref_common.{h, c}."	2014-02-23 08:25:40 -08:00
Yaowu Xu	e22b12e304	Added clamp of qindex to valid range The qindex for a segment was not clamped in ABSDATA mode, which may cause invalid memory access if an ill-formed stream has a negative value in ABSDATA mode. This commit added clamp to make sure qindex for a segment always fall into valid range. Change-Id: I0a74d00f4ef40aec7edaeca1d03c8645e23ab08c	2014-02-22 12:30:18 -08:00
Yaowu Xu	f1633e5844	Merge "Remove an unused variable"	2014-02-21 22:44:05 -08:00
Alex Converse	6e3cf6ec1d	Stop gating non420 features with a configure flag. Change-Id: I8cc38fdef6a2a0968af8dfe15e7c2b3c46c531ea	2014-02-21 12:05:29 -08:00
James Zern	e2f614be53	Merge "vp9_subpixel_8t_intrin_ssse3.c: make some tables static"	2014-02-20 16:02:16 -08:00
James Zern	3240db7407	Merge "vp9_subpixel_8t_intrin_avx2.c: make some tables static"	2014-02-20 16:01:50 -08:00
Yaowu Xu	c58e1c7be9	Remove an unused variable Change-Id: I8eeec70a7d4403243762f14d0b560792801645e8	2014-02-20 14:49:44 -08:00
James Zern	10f2db2b1f	Merge "vp9: normalize DECLARE_ALIGNED use on global tables"	2014-02-19 11:38:47 -08:00
Dmitry Kovalev	d43c5cc5ea	Cleaning up vp9_mvref_common.{h, c}. Hiding vp9_find_mv_refs_idx() inside vp9_mvref_common.c, moving definition of vp9_find_mv_refs() to vp9_mvref_common.c. Change-Id: I0c9f34b03648785a7d18edf6d4fddd34e55dfcc5	2014-02-19 14:23:51 +01:00
Dmitry Kovalev	35bd886864	Merge "Cleaning up pack_inter_mode_mvs() function."	2014-02-19 01:04:36 -08:00
James Zern	b78c219c80	vp9: normalize DECLARE_ALIGNED use on global tables - place extern within the macro - use in the header only Change-Id: I4274b345d8af9ef329c0eb9553a3ddaad70d1d26	2014-02-18 22:57:43 -08:00
James Zern	d73d621e5d	vp9_subpixel_8t_intrin_ssse3.c: make some tables static + fix formatting Change-Id: I344d4de089d03e403f0c7b3e64aeb7086cce86ac	2014-02-18 20:42:00 -08:00
James Zern	a96af49bab	vp9_subpixel_8t_intrin_avx2.c: make some tables static + fix formatting Change-Id: Ia62610bff3d63855104366d7860749b6a3cf4577	2014-02-18 20:40:40 -08:00
James Zern	26c8e720ca	Merge "vp9_filter: move table alignment decl's to header"	2014-02-18 20:15:33 -08:00
Yunqing Wang	0cc71c9c9f	Merge "SSSE3 convolution optimization"	2014-02-18 12:55:34 -08:00
Yunqing Wang	ad8d4454f0	Merge "AVX2 SubPixel Variance Optimization"	2014-02-18 12:18:13 -08:00
Dmitry Kovalev	36420009ea	Changing vp9_full_search_sad{, x3, x8} signatures. Passing block MV pointer instead of block index into vp9_full_search_sad{, x3, x8} functions. Change-Id: Ica07356633471c2c8f81b583a7aeba85a436bafb	2014-02-17 14:24:57 +01:00
James Zern	8092080216	vp9_filter: move table alignment decl's to header avoids mismatched alignment warnings in visual studio builds Change-Id: I2cedb8042fd47e708bde3f7168a6fb4bd9aaa569	2014-02-15 10:18:24 -08:00
James Yu	e486488ce8	Replace vqshrun by vqmovun if shift #0 bit Change-Id: Ifabb8c7ec0c327fea9d6739cab10addb060ff435 Signed-off-by: James Yu <james.yu@linaro.org>	2014-02-14 21:03:40 -08:00
Johann	4378503665	Merge "Remove redundant arm neon instructions."	2014-02-14 20:02:51 -08:00
levytamar82	52dac5d1cb	AVX2 SubPixel Variance Optimization Optimizing 2 functions to process 32 elements in parallel instead of 16: 1. vp9_sub_pixel_variance64x64 2. vp9_sub_pixel_variance32x32 both of those function were calling vp9_sub_pixel_variance16xh_ssse3 instead of calling that function, it calls vp9_sub_pixel_variance32xh_avx2 that is written in avx2 and process 32 elements in parallel. This Optimization gave 70% function level gain and 2% user level gain Change-Id: I4f5cb386b346ff6c878a094e1c3b37e418e50bde	2014-02-14 16:59:11 -07:00
Adrian Grange	b7be30eb36	Cleanup some comments. Change-Id: I568861ba1d43620865ad9a98a97eef37a51fd856	2014-02-14 15:05:30 -08:00
Yaowu Xu	ecf392a155	Merge "minor spelling cleanup in comments"	2014-02-14 14:29:35 -08:00
levytamar82	3068d7d944	SSSE3 convolution optimization Optimizing all SSSE3 assembly for convolution: 1. vp9_filter_block1d4_h8_sse2 2. vp9_filter_block1d8_h8_sse2 3. vp9_filter_block1d16_h8_sse2 4. vp9_filter_block1d4_v8_sse2 5. vp9_filter_block1d8_v8_sse2 6. vp9_filter_block1d16_v8_sse2 my optimization include: -processing 2x8 elements in one 128 bit register instead of processing 8 elements in one 128 bit register. -removing unecessary loads. This optimization gives between 2.4% user level gain for 480p input and 1.6% user level gain for 720p. This Optimization is done only for 64 bit Change-Id: Ic07fce2f9360329b4f2d956efda1480ae958766b	2014-02-14 15:08:42 -07:00
Dmitry Kovalev	19a8eee1f0	Cleaning up pack_inter_mode_mvs() function. Change-Id: I48ad06e3e1ae9720a0683022621f4504e3bebce6	2014-02-13 19:21:10 -08:00
Yaowu Xu	8d646becb6	Merge "Removed the reset of mode_info from previous frame"	2014-02-13 17:03:50 -08:00
Frank Galligan	fb8c246b70	Merge "Add VP9 decoder support for external frame buffers"	2014-02-13 15:29:52 -08:00
Frank Galligan	a4f30a5023	Add VP9 decoder support for external frame buffers Added support for external frame buffers to libvpx's VP9 decoder. If the external frame buffer functions are set then libvpx will call the get function whenever it needs a new frame buffer to decode a frame into. And it will call the release function whenever there are no more references to that buffer. Change-Id: Id2934d005f606af6e052fb6db0d5b7c02f567522	2014-02-13 13:14:19 -08:00
Yaowu Xu	896d79a57e	Removed the reset of mode_info from previous frame Prior to this commit, both encoder and decoder reset mode/mv info from previous frame in error resilient mode to ensure bitstreams are able to decode when there is loss of frame in decoder side. However, this is not necessary. This commit changed to remove the reset, so encoder can continue to use mode/mv/partition information from previously encoded frame without affecting decodeablilty under loss of frame. Change-Id: I0279f862900dc647fb471ae3389770bb1b9f454f	2014-02-13 12:48:08 -08:00
Dmitry Kovalev	df6c523fed	Merge "Renaming skip_coeff to skip for consistency."	2014-02-13 11:04:34 -08:00
Frank Galligan	e5a1b214f7	Merge "Fix neon wide loopfilter for filter8 only branch"	2014-02-13 09:52:48 -08:00
Yunqing Wang	92824a9cbc	Merge "AVX2 Convolve Optimization"	2014-02-13 09:43:55 -08:00
levytamar82	876c72a093	AVX2 Convolve Optimization Two convolve functions were optimized for AVX2: 1. vp9_filter_block1d16_h8 2. vp9_filter_block1d16_v8 vp9_filter_block1d16_v8 was optimized for AVX2 by reducing the number of loop strides by half, two strides were processed in parallel. vp9_filter_block1d16_v8 was also optimized in the same way also some of the loads were being done outside of the loop and by that preventing redundant loads. This Optimization gives 43% function level gain and 1.3% user level gain. Now can be compiled in Windows Change-Id: I2714124cfb0c14a77d7a0ce126a20db92ffbf92c	2014-02-12 20:45:31 -07:00
Frank Galligan	b41acbf9bb	Fix neon wide loopfilter for filter8 only branch The current code removed the check to only perform the filter8. Change-Id: Ie54e19a77745042a5660eab986d9ef1c42e82410	2014-02-12 18:36:17 -08:00
Dmitry Kovalev	004c8c636e	Renaming skip_coeff to skip for consistency. Change-Id: I036e815ca63d00cba71202ae09ba0f6ef745dcb8	2014-02-12 17:44:12 -08:00
Andrew Russell	549c31f8ae	minor spelling cleanup in comments Change-Id: Ia91c6c406273345b08505097ffe1af3896980f06	2014-02-12 16:32:51 -08:00
Dmitry Kovalev	50712fcaa9	Adding consts to mv search function arguments. Change-Id: Ie79114bba4f0cea55d9f701e20d2be2017630f3b	2014-02-12 14:28:23 -08:00
Dmitry Kovalev	0109d757ee	Merge "Removing vp9_foreach_transformed_block_uv() function."	2014-02-12 12:11:14 -08:00
Jingning Han	e8b7610e8f	Use INTER_OFFSET in vp9_pick_inter_mode Cosmetic change to use pre-defined macros. Change-Id: I93e9fa90113d0242599048940b39694660385a6f	2014-02-12 09:14:29 -08:00
James Yu	619f29cdb0	Remove redundant arm neon instructions. Change-Id: I1fabad59747eb5f68c64275a36c3a1d94daf32a3 Signed-off-by: James Yu <james.yu@linaro.org>	2014-02-11 21:19:12 -08:00
Dmitry Kovalev	79dd1f8441	Removing vp9_foreach_transformed_block_uv() function. Change-Id: I35ec77b71e6fd686865cead9281e4dd9e9bc9e86	2014-02-11 18:06:00 -08:00
Tom Finegan	c49c75fde0	Merge "vp9/common/x86: Silence MSVC warnings in vp9_asm_stubs.c."	2014-02-11 14:39:27 -08:00
Frank Galligan	d51ca0db00	Merge "Add get release decoder frame buffer functions."	2014-02-11 08:19:37 -08:00
Dmitry Kovalev	803a5c67dd	Merge "Encoder quantization cleanup."	2014-02-10 21:32:04 -08:00
Tom Finegan	60e91a92c3	vp9/common/x86: Silence MSVC warnings in vp9_asm_stubs.c. Update filter_1dfunction definition to match usage. Change-Id: Ie3cae13dc1ec3f5838c5f29d1c76a1a98a9217fa	2014-02-10 15:08:42 -08:00
Frank Galligan	e8e152799b	Add get release decoder frame buffer functions. This CL changes libvpx to call a function when a frame buffer is needed for decode. Libvpx will call a release callback when no other frames reference the frame buffer. This CL adds a default implementation of the frame buffer callbacks. Currently only VP9 is supported. A future CL will add support for applications to supply their own frame buffer callbacks. Change-Id: I1405a320118f1cdd95f80c670d52b085a62cb10d	2014-02-10 14:08:11 -08:00
Jim Bankoski	3c790ec0f8	Convert small static header functions to inline Change-Id: I467b28346a0d8d4d8b96d6c05fc39c34eec26e5c	2014-02-10 07:56:45 -08:00
Jim Bankoski	b5f59ea280	Convert small static functions in header to inline.. Change-Id: Ic4fc01be7738fbabf8c7860dbe3476ab4caf5fc2	2014-02-10 07:56:38 -08:00
Jim Bankoski	7341725e13	Convert small header functions to inline Change-Id: I4e5575f0d7ccfe2361b8cbf78e7dc079272c9f5f	2014-02-10 07:56:29 -08:00
Jim Bankoski	69f58b40e0	Convert header static functions to inline or make them global. Change-Id: Ib26fbfef3505299f754e5af6c437a85d7746fc28	2014-02-10 07:39:12 -08:00
Jim Bankoski	6a9e58cb1d	Converted functions in header to INLINE... Change-Id: I00512c6cef3a4af8df57c7263ceb853fb2db8140	2014-02-09 20:12:04 -08:00
Jim Bankoski	18c8deabbf	Convert functions to inline that are small . Change-Id: I3b160e93d9319c8e1abda2a60f49f89c409d534b	2014-02-09 20:08:58 -08:00
Jim Bankoski	9768d0b184	Convert functions to inline that are in headers static. Change-Id: If1ec3b64be327e8c48ec7efbacde208d2129fdb0	2014-02-09 20:06:35 -08:00
Jim Bankoski	99e4c508b2	Converted function to inline Change-Id: Iaa4880c8a207cfea509608e1ef4593794b6b31f2	2014-02-09 20:04:54 -08:00
Jim Bankoski	3a3aa3f4e3	Converted short static functions to inline. Change-Id: I859719d41ced2e35d2765b636e627bb7edc3651e	2014-02-09 19:58:54 -08:00
Tom Finegan	bf79a4da77	vp9/common: Silence MSVC warning in vp9_convolve.c. Added cast to int to silence MSVC warning. Change-Id: I9ef4709d2e4cf0db070d9e52385c1b3f138b00a5	2014-02-07 10:13:57 -08:00
Dmitry Kovalev	005fc6970b	Finally removing "short" from transform names. Change-Id: I5259b68dc1bcceb153e3ffe638a79a59a3019e9d	2014-02-06 11:54:15 -08:00
Marco Paniconi	4864ab21b0	Layer based rate control for CBR mode. This patch adds a buffer-based rate control for temporal layers, under CBR mode. Added vpx_temporal_scalable_patters.c encoder for testing temporal layers, for both vp9 and vp8 (replaces the old vp8_scalable_patterns). Updated datarate unittest with tests for temporal layer rate-targeting. Change-Id: I8900a854288b9354d9c697cfeb0243a9fd6790b1	2014-02-06 09:24:45 -08:00
Dmitry Kovalev	f32fa45cba	Merge "Cleaning up vp9_get_pred_context_single_ref_p1()."	2014-02-05 18:38:38 -08:00
Dmitry Kovalev	4a1a7919da	Merge "Removing "_1d" suffix from mips transform code."	2014-02-05 18:37:49 -08:00
Yunqing Wang	7ad56bf3c9	Merge "Optimize bilinear sub-pixel filters in ssse3"	2014-02-05 17:20:52 -08:00
Dmitry Kovalev	724fefb4cf	Cleaning up vp9_get_pred_context_single_ref_p1(). Change-Id: I279343b474d7ff41afcf8f1493b6fbf716b51823	2014-02-05 11:48:01 -08:00
Dmitry Kovalev	a536237228	Merge "Cleaning up vp9_get_pred_context_single_ref_p2()."	2014-02-05 11:37:17 -08:00
Martin Storsjo	03bc491721	arm: Consistently use braces around doubleword arguments to vld This isn't strictly necessary, but makes the file more consistent with the other arm assembly source files. Change-Id: I245c9677d89e0ab3f31991e473764858af35b180	2014-02-05 13:24:25 +02:00
Martin Storsjo	c2bb1aa544	arm: Use {} around quadword arguments to vld This fixes building for iOS. Change-Id: Ice082648c02a3faf93891f7ddc122875e2bdc9cb	2014-02-05 13:24:17 +02:00
James Zern	d89f861f4b	vp9_systemdependent.h: relocate system includes avoid wrapping msvc includes with extern "C"; this breaks some visual studio builds of the (c++) tests. Change-Id: Ie8062d55d4f4c049f6cd360a36da6a67607df132	2014-02-04 18:28:45 -08:00
Dmitry Kovalev	c31cf0d647	Merge "Moving x1 & y1 calculation under if condition."	2014-02-04 14:50:25 -08:00
hkuang	b0fec6ab4a	With on demand border extension, clamping the MV is not longer needed. Change-Id: I40c37ef18c67ab27fc336694dfca3c43a87c47ca	2014-02-04 13:57:40 -08:00
Yunqing Wang	d1961e6fbf	Optimize bilinear sub-pixel filters in ssse3 This patch added ssse3 optimization of bilinear sub-pixel filters. The real time encoder was speeded up by ~1%. Change-Id: Ie82e98976f411183cb8c61ab8d2ba0276e55a338	2014-02-04 08:01:55 -08:00
James Zern	2b7338aca4	Merge "vp9_filter.h: rename interp_kernel type"	2014-02-03 23:12:28 -08:00
Dmitry Kovalev	5daaff527e	Moving x1 & y1 calculation under if condition. Change-Id: Iae787d491f7cfe24855ef8f2d04e2c6c19350378	2014-02-03 18:03:17 -08:00
Dmitry Kovalev	64cca45c1d	Cleaning up vp9_get_pred_context_single_ref_p2(). Change-Id: I294075acd3073c41e153079ff4462816898b3778	2014-02-03 17:46:34 -08:00
James Zern	cca4276dac	vp9_filter.h: rename interp_kernel type -> InterpKernel avoids conflicts in variable names, fixing the build with various toolchains. broken since: `8691565` Removing subpix_fn_table struct. Change-Id: Ib5f6fdbcb494a97b62c75b99d4d826ff25d4c981	2014-02-03 16:48:38 -08:00
Alex Converse	be1b41673f	Merge "INLINE and reimplement get_unsigned_bits()."	2014-02-03 16:26:33 -08:00
Dmitry Kovalev	220b8f8644	Encoder quantization cleanup. Change-Id: I633205c95f0e81ce0589580501d0be4425a3cb8e	2014-02-03 14:57:28 -08:00
Dmitry Kovalev	282f36adc4	Merge "Removing "_short" suffix from arm transform file names."	2014-02-03 14:28:47 -08:00
Alex Converse	ffd3d4834b	INLINE and reimplement get_unsigned_bits(). The new implementation disagrees when the argument is equal to 2**n but that is never called in practice and based on how it is used the new implementation is correct in that case. Change-Id: Ifbac4ad87d459fe6bd2fd0f400c0340f96617342	2014-02-03 12:16:22 -08:00
Yunqing Wang	2488cb34bc	Optimize bilinear sub-pixel filters in sse2 Using bilinear filters could speed up the codec in real-time mode. This patch added sse2 optimizations of bilinear filters that operate on different-sized blocks. Tests showed that the real-time encoder was speeded up by 3%. Change-Id: If99a7ee4385fcc225c3ee7445d962d5752e57c3f	2014-02-03 10:34:45 -08:00
Marco Paniconi	6be2b750b8	Layer based rate control for CBR mode. This patch adds a buffer-based rate control for temporal layers, under CBR mode. Added vpx_temporal_scalable_patters.c encoder for testing temporal layers, for both vp9 and vp8 (replaces the old vp8_scalable_patterns). Updated datarate unittest with tests for temporal layer rate-targeting. Change-Id: I9cb6cce2494390ae6096ee17774af7fb9308bde7	2014-02-02 14:30:43 -08:00
Jim Bankoski	9dec7712ab	static function convert to inline or global vp9_blockd.h Change-Id: Ifdd951f24932839f06d1c700371662511dde6ebe	2014-01-31 19:50:40 -08:00
Yunqing Wang	7c6a49bada	Merge "Rename a loopfilter parameter"	2014-01-31 18:33:33 -08:00
Dmitry Kovalev	c2ca97caaf	Merge "Cleaning up motion compensation code."	2014-01-31 17:33:40 -08:00
Dmitry Kovalev	c49b08c9a1	Removing "_short" suffix from arm transform file names. Change-Id: Iefe118f61a335e88821a21a9f50fb919212c1507	2014-01-31 17:19:02 -08:00
Dmitry Kovalev	6e4a03e844	Removing "_1d" suffix from mips transform code. Unifying transform function names across libvpx, 1d is a redundant suffix. Change-Id: I077c19f3bc7d4842ed7ca5814d77b3dce1728e13	2014-01-31 17:05:03 -08:00
Yunqing Wang	11a9366e3b	Rename a loopfilter parameter As pointed out by Dmitry and James, "partial" is a Microsoft- specific c++ keyword, and it is renamed. Change-Id: Ia0fc11ceb89e54b3195287f89f7e26edbbe9beb8	2014-01-31 16:30:04 -08:00
Dmitry Kovalev	88340b173b	Merge "Combining fb_idx_ref_cnt[] and yv12_fb[] arrays."	2014-01-31 15:55:04 -08:00
Dmitry Kovalev	a8a2f22958	Merge "Renaming "mbskip" to "skip"."	2014-01-31 15:52:35 -08:00
Yunqing Wang	903801f1ef	vp9 decoder: row-based multi-threaded loopfilter Implemented parallel loopfiltering, which uses existing tile- decoding threads. Each thread works on one row, and when that row is loopfiltered, it moves to next unattended row. To ensure the correct filtering order, threads are synchronized and one superblock is filtered only if the superblocks it depends on are filtered already. To reduce synchronization overhead and speed up the decoder, we use nsync > 1 for high resolution. Performance tests: 1. on desktop: 8-tile 4k video using 8 threads, speedup: 70% - 80% 4-tile HD video using 4 threads, speedup: ~35% 2. on mobile device(Nexus 7): 4-tile 1080p video using 4 threads, speedup: 18% - 25% 4-tile 1080p video using 2 threads, speedup: 10% - 15% Change-Id: If54b4a11960dd706c22d5ad145ad94156031f36a	2014-01-31 14:44:53 -08:00
Yaowu Xu	96dc80da61	Merge "create super fast rtc mode"	2014-01-29 16:36:20 -08:00
Dmitry Kovalev	b107f2c470	Renaming "mbskip" to "skip". Change-Id: I27a30b43eae026a77f92958e2238d02d9cdf7832	2014-01-29 14:48:42 -08:00
Dmitry Kovalev	5670f1e2a8	Merge "Finally removing vp9_setup_interp_filters() function."	2014-01-29 12:54:21 -08:00
Dmitry Kovalev	6332063475	Combining fb_idx_ref_cnt[] and yv12_fb[] arrays. Adding new RefCntBuffer struct which contains reference counter and image buffer. Change-Id: I71c1f532faa13442c32c43fc03ec45b6f88fb844	2014-01-29 12:48:01 -08:00
Dmitry Kovalev	b00eb5c464	Finally removing vp9_setup_interp_filters() function. Change-Id: If446225afbb49f6033c2a4516a37c377de6f70f7	2014-01-29 11:29:34 -08:00
Jim Bankoski	ea8aaf15b5	create super fast rtc mode This patch only works if the video is a width and height that are both a multiple of 32.. It sets every partition to 16x16, and does INTRADC only on the first frame and ZEROMV on every other frame. It always does does the largest possible transform, and loop filter level is set to 4. Was ~20% faster than speed -5 of vp8 Now 20% slower but adds motion search ( every block ), nearest, near and zeromv The SVC test was changed because - while this realtime mode produces bad quality albeit quickly, it isn't obeying all the rules it should about which frames are available. Change-Id: I235c0b22573957986d41497dfb84568ec1dec8c7	2014-01-29 08:39:39 -08:00
Yunqing Wang	3c29cbffbf	Add macros for convolve functions Added macros to reduce the code duplication. Change-Id: I1916aa5a386ea07d961d4ec439ab09bb8c45487d	2014-01-28 18:40:23 -08:00
Dmitry Kovalev	b098c04290	Merge "Decoupling set_ref_ptrs() and vp9_setup_interp_filters()."	2014-01-28 10:37:58 -08:00
Dmitry Kovalev	4ce35d8f2d	Merge "Removing _1d suffix from transform names."	2014-01-28 10:37:26 -08:00
hkuang	af87148a22	Merge "Add vp9_tm_predictor_32x32 neon implementation which is 7.8 times faster than C."	2014-01-28 09:57:08 -08:00
Dmitry Kovalev	ff41764920	Removing _1d suffix from transform names. It is enough to specify (e.g.) idct16, it is obviously different from idct16x16. Change-Id: I6b408a37a945de3162429380b59a775b03b95db0	2014-01-27 16:15:36 -08:00
hkuang	770454f3a8	Add vp9_tm_predictor_32x32 neon implementation which is 7.8 times faster than C. Change-Id: I858ef4ec09202a07d445da8db702783d6d9d7321	2014-01-27 16:01:07 -08:00
Dmitry Kovalev	e5b31a1d8c	Decoupling set_ref_ptrs() and vp9_setup_interp_filters(). Change-Id: I8d17867a4772554cbba2bd113cc5b4c99d50146d	2014-01-27 16:00:20 -08:00
Dmitry Kovalev	b2f0ae65c7	Merge "Removing subpix_fn_table struct."	2014-01-27 10:42:42 -08:00
hkuang	05d2081d38	Fix the vp9_tm_predictor_8x8_neon. Change-Id: I832cf83871044bfee7b7e57dbd31bae05cbd53e9	2014-01-27 10:17:20 -08:00
Dmitry Kovalev	8691565441	Removing subpix_fn_table struct. We don't use different filter kernels for x and y, it is always one kernel for both directions. Change-Id: Iefcbb02ec74bf46ea20d9dca672a3efd5d631517	2014-01-24 17:06:26 -08:00
Dmitry Kovalev	f9f936b82f	Merge "Renaming INTERPOLATION_TYPE to INTERP_FILTER."	2014-01-24 16:52:10 -08:00
Frank Galligan	183361dadb	Merge "Optimize vp9_tm_predictor_8x8_neon function"	2014-01-24 16:21:56 -08:00
Dmitry Kovalev	4264c93844	Renaming INTERPOLATION_TYPE to INTERP_FILTER. Corresponding renames: subpel_kernel => interp_kernel vp9_get_filter_kernel() => vp9_get_interp_kernel() pred_filter_type => pred_interp_filter adaptive_pred_filter_type => adaptive_pred_interp_filter mcomp_filter_type => interp_filter read_interp_filter_type() => read_interp_filter() write_interp_filter_type() => write_interp_filter() fix_mcomp_filter_type() => fix_interp_filter() Change-Id: I1fa61fa1dc81ebbf043457c3ee2d8d4515bee6d3	2014-01-24 15:57:28 -08:00
Dmitry Kovalev	03eb63c114	Merge "Removing MODE_STATS."	2014-01-24 15:53:12 -08:00
Frank Galligan	c6d537155c	Merge "Revert external frame buffer code."	2014-01-24 11:31:23 -08:00
Frank Galligan	56a8a0b54b	Optimize vp9_tm_predictor_8x8_neon function Change-Id: Ia12aae491202098ff66366145aa0c3da38dc97e5	2014-01-24 11:07:14 -08:00
hkuang	92ab96a7ae	Merge "Add vp9_tm_predictor_16x16 neon implementation which is 3.5 times faster than C."	2014-01-24 10:48:44 -08:00
James Zern	26c88ec14e	Merge changes I826655a7,I5164df72,Iba9b198c,Ide9a6846,I4f51ce85,I0e6aa00f,Ic334da9a,I252f5f8a,I7865db2d,I13b434b1 * changes: test/: remove unnecessary extern "C"s top-level: add extern "C" to headers vpx_ports: add extern "C" to headers vpx: add extern "C" to headers vp9/encoder: add extern "C" to headers vp9/decoder: add extern "C" to headers vp9/common: add extern "C" to headers vp8/encoder: add extern "C" to headers vp8/decoder: add extern "C" to headers vp8/common: add extern "C" to headers	2014-01-24 10:47:00 -08:00
hkuang	3633ffcbf7	Add vp9_tm_predictor_16x16 neon implementation which is 3.5 times faster than C. Change-Id: I24439ba7a2971829c11620f34848facf2c916678	2014-01-24 10:22:58 -08:00
Frank Galligan	b1c72b633e	Revert external frame buffer code. A future CL will add external frame buffers differently. Squash commit of four revert commits: Revert "Increase required number of external frame buffers" This reverts commit `9e41d569d7`. Revert "Add external constants." This reverts commit `bbf53047b0`. Revert "Add frame buffer lru cache." This reverts commit `fbada948fa`. Conflicts: vpxdec.c Change-Id: I76fe42419923a6ea6c75d9997cbbf941d73d3005 Revert "Add support to pass in external frame buffers." This reverts commit `10f891696b`. Conflicts: test/external_frame_buffer_test.cc vp9/common/vp9_alloccommon.c vp9/common/vp9_reconinter.c vp9/decoder/vp9_decodeframe.c vp9/encoder/vp9_onyx_if.c vp9/vp9_dx_iface.c vpx/vpx_decoder.h vpx/vpx_external_frame_buffer.h vpx_scale/generic/yv12config.c vpxdec.c Change-Id: I7434cf590f1c852b38569980e4247fad0d939c2e	2014-01-24 10:10:20 -08:00
Adrian Grange	8b0537f631	Merge changes I24ad1f0f,I33be1366 * changes: Reorder functions to avoid forward declaration Rename set_scale_factors as set_ref_ptrs	2014-01-24 08:38:52 -08:00
Dmitry Kovalev	6c98df29e4	Cleaning up motion compensation code. Change-Id: I74cf028e8c732cd0dbc070326152d3085b824a80	2014-01-23 17:15:30 -08:00
James Zern	0940c9cfde	vp9/common: add extern "C" to headers Change-Id: Ic334da9aee968e33762c2b25d9fbad24c844b411	2014-01-23 16:21:24 -08:00
Dmitry Kovalev	5f75fda9e9	Merge "Cleaning up vp9_refining_search_sad() function."	2014-01-22 17:15:22 -08:00
hkuang	97826df96b	Add tm_predictor_8x8 neon implementation. Change-Id: I76c2720546b737cb63018a8ab6a3ff62a291786d	2014-01-22 13:43:20 -08:00
Adrian Grange	e37eb0ade7	Rename set_scale_factors as set_ref_ptrs New name better describes what the function does. Change-Id: I33be1366a81f058a9854b804bcde211061187dc7	2014-01-22 13:04:30 -08:00
Johann	4e9dc6d45d	Merge "Match vp9_coefband_trans_* declarations"	2014-01-22 11:10:51 -08:00
Johann	6c492fc2f9	Match vp9_coefband_trans_* declarations VS2013 Chromium builds failed with: warning C4742: 'vp9_coefband_trans_8x8plus' has different alignment in https://code.google.com/p/chromium/issues/detail?id=336620 Change-Id: I865f72bc23ae958531eeb5f497002c12e9a36fcd	2014-01-21 17:07:23 -08:00
hkuang	437004c710	Seperate the border size for encoder and decoder. Encoder's boarder is still 160, while decoder's boarder will be 32. With on demand and separate boarder buffer for boarder extension. The decoder's boarder does not need to to 160 anymore. Change-Id: I93d5aaff15a33a2213e9761eaa37c5f2870747db	2014-01-21 15:28:41 -08:00
Dmitry Kovalev	a001016996	Removing MODE_STATS. Change-Id: I7520e1cc82b749187c9445356dd7b54f3f3826cc	2014-01-17 17:30:22 -08:00
Jingning Han	b461c0884e	Deprecate best_mv from encoder This commit deprecates the use of best_mv from encoding and bit-stream writing stages. It hence removes the definition from MACROBLOCKD. Change-Id: I8e5302775a2aa4a18900726df407bff881f2dfb1	2014-01-17 17:15:34 -08:00
hkuang	671df8486d	Merge "Use a temp buffer for reconstruction when reference buffer is out of boarder."	2014-01-17 16:17:36 -08:00
hkuang	7459fee8c6	Use a temp buffer for reconstruction when reference buffer is out of boarder. Change-Id: Ic7ad136e54a4d68abe0fd4345146a86b0ba824e1	2014-01-17 16:15:54 -08:00
Dmitry Kovalev	d8bfe9e24c	Cleaning up vp9_refining_search_sad() function. Change-Id: I660b53da8ebf3049832ce8a10721051c4e0ebb00	2014-01-17 15:20:28 -08:00
Dmitry Kovalev	ac40c87f68	Removing unused vp9_yv12_copy_partial_frame() function. Change-Id: I3149e562fe9500914f67b6f908283edcdc381ac6	2014-01-16 18:16:34 -08:00
Yunqing Wang	d2bb0c51d3	Revert "Revert "Revert "SSSE3 convolution optimization""" This reverts commit `f9404f2406`. This patch caused some ASAN error. Change-Id: If15b7e581310e19061d111c69f2931809662ed19	2014-01-16 16:11:46 -08:00
hkuang	2a2d8c140f	Merge "Add vp9_tm_predictor_4x4 neon implementation"	2014-01-16 10:18:12 -08:00
Dmitry Kovalev	67e4ca2a1a	Merge "Cleaning up postproc code."	2014-01-15 16:23:54 -08:00
Yaowu Xu	056db03d17	Merge "Revert "Revert "SSSE3 convolution optimization"""	2014-01-15 15:03:25 -08:00
Deb Mukherjee	8ce5f68fe4	Merge "Rearranges the END_USAGE typedef"	2014-01-15 14:01:30 -08:00
hkuang	f2ef389256	Add vp9_tm_predictor_4x4 neon implementation Change-Id: I10c423bde7ea5a3bac9f14f35c73b6bc31c8f3e3	2014-01-15 11:51:36 -08:00
Deb Mukherjee	f32106951a	Rearranges the END_USAGE typedef Rearranges the END_USAGE typedef to make it compatible with the vpx user input. Change-Id: Ic9fa9e9edbee7c0ad01e12e685b219582fcecd16	2014-01-15 10:10:23 -08:00
Adrian Grange	c3011e6f90	Delete outdated comment & tidy-up others Change-Id: I83031180723ee59270ec8fb66b2f73c0796bee25	2014-01-15 09:53:03 -08:00
Dmitry Kovalev	a540f8a0b0	Cleaning up postproc code. Change-Id: I7e53f6345a4cf89309262f50850c9ad08ed3c527	2014-01-14 15:49:19 -08:00
Yunqing Wang	f9404f2406	Revert "Revert "SSSE3 convolution optimization"" This reverts commit `b645257121`. Change-Id: I60d1bf57ae8e9eb6127f42f2d5a780124ac51b45	2014-01-13 12:29:55 -08:00
James Zern	f83c12b540	Merge "cosmetics: vp9_reconinter.h: make some variables const"	2014-01-11 12:39:32 -08:00
Dmitry Kovalev	96be0a50ab	Removing mi_height_log2_lookup table. Change-Id: I1f0ae2edc3a96b33c0494d165ae756a8feba6184	2014-01-10 13:29:47 -08:00
Paul Wilkins	b645257121	Revert "SSSE3 convolution optimization" This reverts commit `511d218c60`. In current form intrinsics break borg build. Change-Id: Ied37936af841250ecff449802e69a3d3761c91b9	2014-01-10 13:38:26 +00:00
Jingning Han	a4c94a94cc	Merge "Optimze inv 16x16 DCT with 10 non-zero coeffs - P2"	2014-01-09 18:17:25 -08:00
Jingning Han	faa2ba86cc	Merge "Optimze inv 16x16 DCT with 10 non-zero coeffs - P1"	2014-01-09 18:17:12 -08:00
Dmitry Kovalev	c8e8d3a461	Merge "Renaming 'Sharpness' to 'sharpness'."	2014-01-09 13:42:55 -08:00
Jingning Han	af31b27aae	Optimze inv 16x16 DCT with 10 non-zero coeffs - P2 This commit further optimizes SSE2 operations in the second 1-D inverse 16x16 DCT, with (<10) non-zero coefficients. The average runtime of this module goes down from 779 cycles -> 725 cycles. Change-Id: Iac31b123640d9b1e8f906e770702936b71f0ba7f	2014-01-09 12:46:09 -08:00
Yunqing Wang	f3b9b97c0e	Merge "SSSE3 convolution optimization"	2014-01-09 12:39:47 -08:00
levytamar82	511d218c60	SSSE3 convolution optimization Optimizing all SSSE3 assembly for convolution: 1. vp9_filter_block1d4_h8_sse2 2. vp9_filter_block1d8_h8_sse2 3. vp9_filter_block1d16_h8_sse2 4. vp9_filter_block1d4_v8_sse2 5. vp9_filter_block1d8_v8_sse2 6. vp9_filter_block1d16_v8_sse2 my optimization include: -processing 2x8 elements in one 128 bit register instead of processing 8 elements in one 128 bit register. -removing unecessary loads. This optimization gives between 2.4% user level gain for 480p input and 1.6% user level gain for 720p. This Optimization done only for 64bit. Change-Id: Icb586dc0c938b56699864fcee6c52fd43b36b969	2014-01-09 12:27:51 -07:00
Dmitry Kovalev	4fbe54d201	Merge "Renaming 'Mode' to 'mode'."	2014-01-08 16:29:29 -08:00
Jingning Han	ba6ab46cdc	Optimze inv 16x16 DCT with 10 non-zero coeffs - P1 This commit is the first patch optimizing SSE2 implementation of inverse 16x16 DCT with <10 non-zero coefficients. It focused on the first 1-D (row) transformation. It exploits the fact that only top-left 4x4 block contains non-zero coefficients, in a 2-D inverse 16x16 DCT with <10 coeffients. The average runtime of idct16x16_10 unit is reduced from 883 cycles -> 779 cycles (12% faster). For pedestrian_area_1080p 300 frames at 4000 kbps, the speed 2 runtime goes down from 310651 ms -> 305910 ms. The decoding speed goes up from 80.37 fps -> 80.87 fps. Change-Id: Ic6f3ac5a637a76c07ba73ddaafe318a699fea645	2014-01-08 15:36:45 -08:00
Alex Converse	8fcb74e6bb	Merge "Add a C fallback for get_msb() and change inline to INLINE."	2014-01-08 14:43:46 -08:00
hkuang	5be0ed30dc	Merge "Add initial intra frame neon optimization. 1~2% gain."	2014-01-08 14:41:43 -08:00
Dmitry Kovalev	962c8b241e	Renaming 'Mode' to 'mode'. Change-Id: I6cdd670d66288dbd66228f38bba6b30502d25362	2014-01-08 14:33:59 -08:00
Dmitry Kovalev	57be81369a	Renaming 'Sharpness' to 'sharpness'. Change-Id: I54513dc3b3321e0c0bb6b15ea5c34085ed80b4a4	2014-01-08 14:19:14 -08:00
Alex Converse	ce7ff3b63d	Add a C fallback for get_msb() and change inline to INLINE. For systems without __builtin_clz() or _BitScanReverse(), taken from libwep Change-Id: Iead257efc1772c466c79e1dc0356ed571d38d43e	2014-01-08 12:25:47 -08:00
hkuang	691111aacf	Add initial intra frame neon optimization. 1~2% gain. More intra optimizations will be added. Change-Id: I33ae8d93f6002bf7b64cc2669602d9e6bfa5a6e8	2014-01-08 11:58:42 -08:00
Yunqing Wang	a84029ad9c	Merge "AVX2 Variance Optimization"	2014-01-08 11:33:42 -08:00
levytamar82	357b65369f	AVX2 Variance Optimization Optimizing the variance functions: vp9_variance16x16, vp9_variance32x32, vp9_variance64x64, vp9_variance32x16, vp9_variance64x32, vp9_mse16x16 by migrating to AVX2 some of the functions were optimized by processing 32 elements instead of 16. some of the functions were optimized by processing 2 loop strides of 16 elements in a single 256 bit register This optimization gives between 2.4% - 2.7% user level performance gain and 42% function level gain. Change-Id: I265ae08a2b0196057a224a86450153ef3aebd85d	2014-01-08 12:05:53 -07:00
Alex Converse	f2ca665f1c	Replace RD modeling with a fixed point approximation. Change-Id: I44eb44eb3f36c05d916ef140ef42cc84f72f99ec	2014-01-08 10:37:24 -08:00
Dmitry Kovalev	bbb25e6a39	Merge "Adding RefBuffer struct."	2014-01-06 14:19:44 -08:00
Jingning Han	b49e9fb433	Merge "Tune IDCT8_1D macro function interface"	2014-01-06 09:38:19 -08:00
Dmitry Kovalev	0c5575fe57	Merge "Moving hev mask calculation into filter4() function."	2014-01-03 15:56:16 -08:00
Jingning Han	3e0c62b53f	Tune IDCT8_1D macro function interface This commit adds input/output ports for IDCT8_1D macro function to provide more flexibility in variable use. It allows to skip several buffer swap operations. Change-Id: I21f3450509537322293043b3281bfd3949868677	2014-01-03 15:23:47 -08:00
Dmitry Kovalev	ba41e9d459	Adding RefBuffer struct. Adding RefBuffer to simplify reference buffer management. The struct has a pointer to image data and scale factors relative to the current frame. Change-Id: If38eb1491ff687cc11428aee339f3e052e2c5d9e	2014-01-03 15:21:55 -08:00
Jingning Han	0b1a27135a	Reduce num of buffer swap calls in idct8_1d_sse2 This commit merges the initial buffer swap operations in idct8_1d_sse2 into the array transpose step, hence reducing number of instructions therein. Change-Id: I219f6f50813390d2ec3ee37eecf2a4a2b44ae479	2014-01-03 12:12:03 -08:00
Jingning Han	1bb11781e2	Rework idct8x8_10 SSE2 implementation This commit optimizes the SSE2 implmentation of idct8x8_10. It exploits the fact that only top-left 4x4 block contains non-zero coefficients, and hence reduces the instructions needed. The runtime of idct8x8_10_sse2 goes down from 216 to 198 CPU cycles, estimated by averaging over 100000 runs. For pedestrian_area_1080p 300 frames coded at 4000kbps, the average decoding speed goes up from 79.3 fps to 79.7 fps. Change-Id: I6d277bbaa3ec9e1562667906975bae06904cb180	2014-01-03 12:04:09 -08:00
Yaowu Xu	8458c8c450	Merge "Fix show existing frame"	2014-01-02 09:27:28 -08:00
Dmitry Kovalev	f3beca079c	Merge "Calculating has_second_ref only once for single_ref context."	2013-12-26 13:41:02 -08:00
Dmitry Kovalev	1e8b5bf4ac	Merge "Removing vp9_findnearmv.{h, c} files."	2013-12-26 13:38:38 -08:00
James Zern	44963dfd37	cosmetics: vp9_reconinter.h: make some variables const Change-Id: If5cd0a1487e97c8e9d13dc2e078c6dceaf79de4f	2013-12-26 14:02:46 -05:00
Dmitry Kovalev	87440aeb82	Moving MAX_PROB constant to vp9_prob.h. Change-Id: I07470ad1b7a0344d088911428ffab8ba9a0d8708	2013-12-20 15:56:59 -08:00
Dmitry Kovalev	b3b9f4a4d0	Merge "Using single struct to represent scale factors."	2013-12-20 11:22:02 -08:00
Yunqing Wang	b6a0ac11f0	Merge "Code clean up"	2013-12-20 08:46:11 -08:00
Dmitry Kovalev	987810ad95	Removing vp9_findnearmv.{h, c} files. Moving all code from that files to vp9_mvref_common.{h, c}. Change-Id: Ibc4afcb8cea6847166ff411130e93611ebe63b20	2013-12-19 17:39:57 -08:00
Dmitry Kovalev	a3fbcc88bb	Using single struct to represent scale factors. Moving back to scale_factors struct. We don't need anymore x_offset_q4 and y_offset_q4 because both values are calculated locally inside vp9_scale_mv function. Change-Id: I78a2122ba253c428a14558bda0e78ece738d2b5b	2013-12-19 16:06:33 -08:00
Dmitry Kovalev	c872d2be65	Call set_scaled_offsets() just before scale_mv() call. Before mv scaling it is required to calculate x_offset_q4/y_offset_q4 by calling set_scaled_offsets(). Now offset configuration can not be missed because it happens just before scale_mv(). Change-Id: I7dd1a85b85811a6cc67c46c9b01e6ccbbb06ce3a	2013-12-19 14:55:13 -08:00
Yunqing Wang	09faf55916	Code clean up Removed unused filter coefficients. Change-Id: Ib395a51305e23ff41ab69c1808d56946d25961cd	2013-12-19 11:09:23 -08:00
Dmitry Kovalev	c67ee5ea24	Merge "Converting vp9_treecoder.h to vp9_prob.{h, c}"	2013-12-19 11:03:30 -08:00
Marco Paniconi	02d5ebcfdc	Merge "Updates for 1-pass CBR rate control."	2013-12-18 10:28:33 -08:00
Marco Paniconi	1b8b8b0d0d	Updates for 1-pass CBR rate control. Adjustments based on buffer level, frame dropper. Change-Id: Iaa85b570493526a60c4b9fb7ded4c0226b1b3a33	2013-12-18 09:24:24 -08:00
Jim Bankoski	9d754dcca8	Merge "rename loop filter functions"	2013-12-17 18:56:09 -08:00
Jim Bankoski	b720ba165f	rename loop filter functions This renames all the loop filter functions so that they no longer refer to mb Change-Id: I8a58a8c7fd253d835cb619bde13913e896ece90b	2013-12-17 17:34:34 -08:00
Dmitry Kovalev	118c8fb3fb	Calculating has_second_ref only once for single_ref context. Change-Id: Ib1253e0606426850f53060a4c5303af86bf1c093	2013-12-17 17:02:24 -08:00
Dmitry Kovalev	c6a1ff223b	Merge "Calling is_inter_block() only if mbmi is available."	2013-12-17 16:10:56 -08:00
Dmitry Kovalev	4821084b3f	Moving hev mask calculation into filter4() function. Change-Id: Ieccf2070b2b01b4135f4c5f9857667eb7825c761	2013-12-17 15:23:23 -08:00
Dmitry Kovalev	eb0c73b6e0	Merge "Converting mode_lf_lut struct member into static lookup table."	2013-12-17 15:20:05 -08:00
James Zern	bd9a388a06	vp9: normalize include guards Change-Id: If4ddbdcfb3ab387cbca6910b42cf4df8111e6879	2013-12-16 19:40:49 -08:00
Yaowu Xu	3cce464342	Define POSITION to differentiate from MV MV struct was ussed to indicate the postition of a MI_BLOCK with row and col components. The expression was confusing, this commit added a new stucture "POSITION" with row and col component to better describe the position of a mi_block. Change-Id: I59fdd4b45010fe7d85a8db22a55503265c4f5b2b	2013-12-16 17:28:00 -08:00
Yaowu Xu	50ec6311e6	Move two functions to encoder As they are used by encoder only. Change-Id: I7b1e6955b218aba66fe156523521a8121c9a84a4	2013-12-16 17:27:48 -08:00
Dmitry Kovalev	bb7b4bad6d	Merge "Getting rid of b_{width, height}_log2 calls in non-420 loop filter."	2013-12-16 15:10:25 -08:00
Dmitry Kovalev	865d5b83f2	Calling is_inter_block() only if mbmi is available. Modifying vp9_get_intra_inter_context(), vp9_get_reference_mode_context(), vp9_get_pred_context_single_ref_p1(), vp9_get_pred_context_single_ref_p2() functions. Change-Id: Ifaa2c3eb0c76a544ae8bd1fe3155aada266eae78	2013-12-16 15:09:33 -08:00
hkuang	fb53409d2a	Merge "Remove border extension in intra frame prediction."	2013-12-16 14:48:54 -08:00
Dmitry Kovalev	b1d821704b	Merge "Yet another vp9_pred_common.c cleanup."	2013-12-16 14:10:52 -08:00
hkuang	25e5552630	Remove border extension in intra frame prediction. Change-Id: Id677df4d3dbbed6fdf7319ca6464f19cf32c8176	2013-12-16 14:05:58 -08:00
Dmitry Kovalev	b5c9261832	Converting vp9_treecoder.h to vp9_prob.{h, c} Moving vp9_norm probability table from vp9_entropy.c to vp9_prob.c Change-Id: Ie757b73860c6f43130790c332b292e2a1a81b788	2013-12-16 12:53:09 -08:00
Frank Galligan	fbada948fa	Add frame buffer lru cache. Add an option for libvpx to return the least recently used frame buffer. Change-Id: I886a96ffb94984f1c42de53086e0131922df3260	2013-12-15 19:57:42 -08:00
Frank Galligan	d0ee1fd797	Merge "Add support to pass in external frame buffers."	2013-12-15 19:18:25 -08:00
Frank Galligan	10f891696b	Add support to pass in external frame buffers. VP9 decoder can now use frame buffers passed in by the application. Change-Id: I599527ec85c577f3f5552831d79a693884fafb73	2013-12-15 18:45:46 -08:00
Dmitry Kovalev	4d2d1591a3	Converting mode_lf_lut struct member into static lookup table. Change-Id: I6e6c7cb5ff5b60fbe6a7c314daec5ccdc2cafcc3	2013-12-14 17:42:12 -08:00
Dmitry Kovalev	2aadc06e0d	Yet another vp9_pred_common.c cleanup. Change-Id: I617d6c610d181076773c5c3d6f3dbc6717b02580	2013-12-14 17:39:24 -08:00
Dmitry Kovalev	64cf398713	Merge "Using MV struct instead of int_mv union in encoder."	2013-12-13 16:42:54 -08:00
Dmitry Kovalev	33df4f0483	Merge "vp9_convole.c cleanup."	2013-12-13 15:40:00 -08:00
Dmitry Kovalev	f54b515797	Merge "Cleaning up vp9_append_sub8x8_mvs_for_idx()."	2013-12-13 15:38:53 -08:00
Dmitry Kovalev	25da21b14e	Using MV struct instead of int_mv union in encoder. Change-Id: I8b81a3e4b4fa530a654c28d9c136afa0c1d379fd	2013-12-13 15:24:48 -08:00
Dmitry Kovalev	466cc94e7a	Getting rid of b_{width, height}_log2 calls in non-420 loop filter. Using num_{4x4, 8x8}_blocks_{wide, high}_lookup instead. Change-Id: I66a7ab807fa57395253b2d0e636c2479fa8c4adf	2013-12-13 12:53:41 -08:00
James Zern	178db94cd6	vp9 asserts: fix compile warning string literal to int within an assert Change-Id: I0c889256b67a078e6e2a79577f0b7ae084243258	2013-12-12 19:49:19 -08:00
Dmitry Kovalev	629fb85f17	vp9_convole.c cleanup. Making overall logic more clear, moving "hacked" calculation of base filter array pointer to get_filter_base() function. Change-Id: Ibbd38a9f937e48d35bbbfef3ad933ab36664cccb	2013-12-12 11:14:06 -08:00
Deb Mukherjee	7edd5170b5	Merge "Changes interfaces to vp9_get_compressed_data fn"	2013-12-11 15:50:40 -08:00
Dmitry Kovalev	e79103166f	Merge "Renames for consistency in vp9_pred_common.{c, h} files."	2013-12-11 14:30:44 -08:00
Deb Mukherjee	e33855cc47	Changes interfaces to vp9_get_compressed_data fn Silences some lint warnings in previous patches Change-Id: I04bf47ebe7e63a95fd322719a3154e589c115d78	2013-12-11 14:22:51 -08:00
hkuang	9460226acd	Merge "Fix valgrind error."	2013-12-11 13:22:32 -08:00
hkuang	1339f3842c	Fix valgrind error. Temporarily change memcpy to memmove. Change-Id: I700a197bc1ce496be1ddad7118429c5da465b0ca	2013-12-11 13:21:28 -08:00
Dmitry Kovalev	3274fc30ee	Renames for consistency in vp9_pred_common.{c, h} files. Change-Id: Icba06e84ca55c419abbacedf5825eeb394a1b140	2013-12-10 18:31:46 -08:00
Dmitry Kovalev	098d13ba10	Cleaning up vp9_append_sub8x8_mvs_for_idx(). Replacing if-else with switch statement, reordering function arguments. Change-Id: I4825d2ef311ba8999b6d4ceb0eef003587a13434	2013-12-10 17:56:53 -08:00
Dmitry Kovalev	2dd20e468a	Cleaning up skip context calculation. Renames: vp9_get_pred_context_mbskip => vp9_get_skip_context vp9_get_pred_prob_mbskip => vp9_get_skip_prob Change-Id: I2af499848ef73f3f5cd8cdb27852d0bcdfe31d09	2013-12-10 14:11:26 -08:00
Dmitry Kovalev	35b7b0b549	Merge "Removing unused vp9_get_pred_flag_mbskip() function."	2013-12-10 13:58:35 -08:00
hkuang	19bbe41c71	Merge "Refactor inter_predictor function."	2013-12-10 13:34:24 -08:00
Dmitry Kovalev	48088f210d	Removing unused vp9_get_pred_flag_mbskip() function. Change-Id: Ib46a97d8ff9f2915b9fa2abba3cd18b6711fcb0c	2013-12-10 12:53:17 -08:00
Dmitry Kovalev	e18eb7721e	Merge "Renaming comp_pred_mode to reference_mode."	2013-12-10 10:52:34 -08:00
hkuang	6c9dcae532	Refactor inter_predictor function. Change-Id: Ic429b2f16462e926f30efb3af4da3080026359d8	2013-12-10 10:36:44 -08:00
Dmitry Kovalev	d2dad31e79	Merge "Cleaning up vp9_get_pred_context_switchable_interp() functuion."	2013-12-09 17:34:30 -08:00
hkuang	d70a8c09c6	Merge "Implenment on demand border extension. In place extend the border now. Next commit will totally remove the border."	2013-12-09 17:16:31 -08:00
Dmitry Kovalev	9edd4d4db7	Cleaning up vp9_get_pred_context_switchable_interp() functuion. Change-Id: I67a45a41312ca0efd8fe00ccd8bdc0f97675d09f	2013-12-09 17:02:38 -08:00
hkuang	ff2c96be1f	Implenment on demand border extension. In place extend the border now. Next commit will totally remove the border. Change-Id: Ic1e1ca9cc34f81c688715b3948689b47df63a151	2013-12-09 16:44:08 -08:00
Jingning Han	f92b5842bf	Merge "Full range motion search for regular block sizes"	2013-12-09 16:12:35 -08:00
Dmitry Kovalev	08c48ddc01	Renaming comp_pred_mode to reference_mode. Change-Id: I83ffed2b1878a35ac35f07f9ee74309adc9c7b11	2013-12-09 15:13:34 -08:00
Dmitry Kovalev	347df4ce55	Merge "Renaming vp9_get_pred_context_tx_size() function."	2013-12-09 15:10:49 -08:00
Dmitry Kovalev	2c3120274a	Removing max_uv_txsize_lookup lookup table. Adding get_uv_tx_size_impl() with tx size selection logic, rewriting get_uv_tx_size(). Change-Id: I3ecb108059a41be227a8c89a0710bd174f508951	2013-12-09 14:03:23 -08:00
Dmitry Kovalev	a19d694f09	Merge "Removing BLOCK_TYPES and adding PLANE_TYPES constant instead."	2013-12-07 02:20:41 -08:00
Dmitry Kovalev	cb92f4f042	Renaming vp9_get_pred_context_tx_size() function. Change-Id: Ia6d6f4dfb1fd1ec0f8ba53796b59a802e9d7881d	2013-12-06 15:31:06 -08:00
Dmitry Kovalev	b6e5bb27c9	Merge "Renaming reference mode context calculation function."	2013-12-06 14:22:47 -08:00
Jingning Han	b295092b8f	Full range motion search for regular block sizes Add a full range motion search for regular block sizes. This runs exhaustive search within the given reference area. This commit further optimizes the search process by combining 4 points test into one pipeline, which gives 30% speed-up as compared to run each individual point at a time. This full range search serves as a best possible motion search reference. When replacing the diamond search with full range search, the speed 0 runtime of bus CIF at 2000 kbps goes from 153872ms to 623051ms. The compression performance compared to speed 0 setting gains 0.585% for derf set. Change-Id: Ieef1225216b0b86b4ac4872fa7fb9e18bf2eabb3	2013-12-06 12:24:53 -08:00
Dmitry Kovalev	2da30a96d4	Merge "Removing duplicated C code from vp9_loopfilter_filters.c file."	2013-12-06 12:13:24 -08:00
Dmitry Kovalev	63963f51ef	Renaming reference mode context calculation function. Renames: vp9_get_pred_context_comp_inter_inter => vp9_get_reference_mode_context vp9_get_pred_prob_comp_inter_inter => vp9_get_reference_mode_prob Change-Id: I3bbb69481e6b0c848028667c9269f567f293d3bd	2013-12-06 11:23:01 -08:00
Dmitry Kovalev	d6b159d4a6	Removing BLOCK_TYPES and adding PLANE_TYPES constant instead. Change-Id: Ic3bb862e93aedf6a489a33ea6f7e5097d96855ee	2013-12-06 10:54:00 -08:00
Dmitry Kovalev	cf4dfdc8e7	Merge "Moving vp9_tree_probs_from_distribution() to encoder."	2013-12-06 10:18:30 -08:00
Dmitry Kovalev	8eac2ca840	Merge "Renaming constants."	2013-12-06 09:55:02 -08:00
Dmitry Kovalev	5be34ba80f	Merge "vp9_get_pred_context_intra_inter() clean up."	2013-12-06 09:14:36 -08:00
Adrian Grange	de2046275d	Merge "Remove redundant calls to vp9_update_mode_info_border"	2013-12-06 08:59:47 -08:00
Dmitry Kovalev	4ac6a2552b	Moving vp9_tree_probs_from_distribution() to encoder. Writing custom coeff branch count calculation (which is much clearer) in adapt_coef_probs() function. Removing vp9_treecoder.c file. Change-Id: I8880fb7a39996c8bcf6cd0acf9898a8c712ba91f	2013-12-05 18:13:26 -08:00
Dmitry Kovalev	377fa8aff8	Renaming PREV_COEF_CONTEXTS to COEFF_CONTEXTS. Also adding BAND_COEFF_CONTEXTS macro to simplify for loop logic. Change-Id: I12a78a49cf1addf81e6b3fe2a3736ec2b79bd79e	2013-12-05 17:08:06 -08:00
Dmitry Kovalev	6fd71e1b09	vp9_get_pred_context_intra_inter() clean up. Renaming: vp9_get_pred_context_intra_inter => vp9_get_intra_inter_context vp9_get_pred_prob_intra_inter => vp9_get_intra_inter_prob Change-Id: I2c1affea2e84f4e616137c6df82adb11c7845781	2013-12-05 17:01:03 -08:00
Dmitry Kovalev	f7396f3394	Merge "Removing vp9_default_coef_probs.h file."	2013-12-05 16:44:26 -08:00
Dmitry Kovalev	0d4b8d7e43	Renaming constants. NUM_YV12_BUFFERS => FRAME_BUFFERS ALLOWED_REFS_PER_FRAME => REFS_PER_FRAME NUM_REF_FRAMES_LOG2 => REF_FRAMES_LOG2 NUM_REF_FRAMES => REF_FRAMES NUM_FRAME_CONTEXTS_LOG2 => FRAME_CONTEXTS_LOG2 NUM_FRAME_CONTEXTS => FRAME_CONTEXTS Change-Id: I4e1ada08f25d8fa30fdf03aebe1b1c9df0f87e63	2013-12-05 16:23:09 -08:00
Dmitry Kovalev	2b95a05bf6	Removing duplicated C code from vp9_loopfilter_filters.c file. Change-Id: I299b621fca1c8ff5d296afde9698cdcccfecaf3f	2013-12-05 15:49:57 -08:00
Adrian Grange	93d8a3fd29	Remove redundant calls to vp9_update_mode_info_border Removed calls to vp9_update_mode_info_border since they immediately followed code that initialized the entire buffer to 0. Change-Id: Ife06794daa20439a0b607a83a87f88df59afac40	2013-12-05 15:02:32 -08:00
Dmitry Kovalev	6df9ec52a0	Merge "Cleaning up vp9_get_pred_context_tx_size() function."	2013-12-05 09:59:00 -08:00
Tero Rintaluoma	047b0b01bb	Fix show existing frame - Disable mode info update in case where current frame is coded as "show existing frame". - Should fix issue 676. Change-Id: Ibee681850eb307f982da6528d3e31cb94f881c08	2013-12-05 12:10:10 +02:00
Frank Galligan	7ecf3bc91c	Fix ref count decrement code. Buffer 0 would never be decremented, so it could only be used once. Change-Id: I605d99fa2a513eadae6a0e230161729880653282	2013-12-04 22:21:00 -08:00
Dmitry Kovalev	5eeffc9fc5	Cleaning up vp9_get_pred_context_tx_size() function. Change-Id: Ia6ef876e3d1e66b2182a9c0bce3fd758691cd381	2013-12-04 21:35:30 -08:00
Dmitry Kovalev	a1123538a5	Moving vp9_token from common to encoder. Change-Id: I40a070c353663e82c59e174d7c92eb84f72ed808	2013-12-04 19:36:58 -08:00
Frank Galligan	8363349b84	Merge "Fix the initial references to frame buffers."	2013-12-04 19:26:40 -08:00
Dmitry Kovalev	4afd141a05	Removing vp9_default_coef_probs.h file. Moving all probability tables from removed file to vp9_entropy.c. Change-Id: I12846f1da778c3016d96b82e53384d4634883430	2013-12-04 17:04:35 -08:00
Dmitry Kovalev	cf8e3d2c5c	Merge "Cleaning up vp9_dec_build_inter_predictors_sb function."	2013-12-04 16:57:54 -08:00
Frank Galligan	9ed616a56c	Fix the initial references to frame buffers. The old code would start in a mixed state, where all the reference frames were pointing to frame buffer 0, but the reference counts were 0. This is why we needed special code for the first frame. Change-Id: I734961012917654ff8c0c8b317aac00ab75ded1a	2013-12-04 16:53:18 -08:00
Dmitry Kovalev	3712b58c2f	Merge "Cleaning up vp9_entropy.h file."	2013-12-04 16:46:41 -08:00
Dmitry Kovalev	c6ca5c5ad9	Compact formatting default_coef_probs_{4x4, 8x8, 16x16, 32x32}. Change-Id: If40b930431766d5179b9769509b5e4ca1628e9cc	2013-12-04 15:45:28 -08:00
Dmitry Kovalev	da2da79012	Merge "Formatting vp9_pareto8_full array."	2013-12-04 12:22:50 -08:00
Dmitry Kovalev	beb35aba19	Cleaning up vp9_dec_build_inter_predictors_sb function. Using get_plane_block_size() instead of manipulation with subsampling values, calculating all required values only once without redundant calls to b_width_log2(). Change-Id: I00303f2a0926f9c4cb17f34591adda60615f8919	2013-12-04 12:11:01 -08:00
Yunqing Wang	f6582d6928	Revert "Simplify mask checking in loop filters" Jingning saw bitstream change with this patch. It could be true that (mask_16x16_0 & 1) is 1, but (mask_16x16_1 & 1) is 0 in some edge cases. This reverts commit `8f05e70340`. Change-Id: I0a529435ce816a1e14653eb510d5090de276070a	2013-12-04 11:31:19 -08:00
Dmitry Kovalev	1470789927	Merge "Moving eob array to the encoder."	2013-12-04 10:58:02 -08:00
Yunqing Wang	920a074e89	Merge "Improve idct16x16: _256_add_sse2(x1.107)&_10_add_sse2(x1.012)"	2013-12-04 08:50:51 -08:00
Dmitry Kovalev	ff6d6a9f07	Formatting vp9_pareto8_full array. Change-Id: Ic7f47a8d233daf5e61e82092865837ea4eda4095	2013-12-03 18:49:19 -08:00
Dmitry Kovalev	f00d157c12	Moving eob array to the encoder. In the decoder we don't need to save eobs, we can pass eob as an argument. That's why removing eob arrays from VP9Decompressor and TileWorkerData, and moving eob pointer from macroblockd_plane to macroblock_plane. Change-Id: I8eb919acc837acfb3abdd8319af63d1bbca8217a	2013-12-03 17:59:32 -08:00
Dmitry Kovalev	8e89e2f2e0	Cleaning up vp9_entropy.h file. Renaming constants for consistency: DCT_VAL_CATEGORY1 => CATEGORY1_TOKEN DCT_VAL_CATEGORY2 => CATEGORY2_TOKEN DCT_VAL_CATEGORY3 => CATEGORY3_TOKEN DCT_VAL_CATEGORY4 => CATEGORY4_TOKEN DCT_VAL_CATEGORY5 => CATEGORY5_TOKEN DCT_VAL_CATEGORY6 => CATEGORY6_TOKEN DCT_EOB_TOKEN => EOB_TOKEN DCT_EOB_MODEL_TOKEN => EOB_MODEL_TOKEN MAX_ENTROPY_TOKENS => ENTROPY_TOKENS Moving constants: INTER_MODE_CONTEXTS from vp9_entropy.h to vp9_blockd.h. EOSB_TOKEN from vp9_entropy.h to vp9_tokenize.h Change-Id: I5fcbf081318e1d365792b6d290a930c6cb0f3fc2	2013-12-03 17:23:03 -08:00
Dmitry Kovalev	09577b8c8d	Merge "Removing dummy assignments."	2013-12-03 10:59:34 -08:00
Abo Talib Mahfoodh	e4419ab691	Improve idct16x16: _256_add_sse2(x1.107)&_10_add_sse2(x1.012) The performance gain of idct16x16_10_add_sse2 function is not noticeable. However since both functions use the IDCT16_1D, idct16x16_10_add_sse2 should be modified as well. Tested with: park_joy_420_720p50.y4m Change-Id: I02b957e36fcf997c677d15baf496533895271bff	2013-12-02 21:08:56 -05:00
Yunqing Wang	8f182a1cac	Merge "improve vp9_idct32x32_34(x1.472)&1024(x1.032)_add_sse2"	2013-12-02 15:10:05 -08:00
Yunqing Wang	37e68aba55	Merge "Simplify mask checking in loop filters"	2013-12-02 12:06:26 -08:00
Dmitry Kovalev	862c22cf7d	Merge "Moving token-encoding related stuff from common to encoder."	2013-12-02 10:32:04 -08:00
Yunqing Wang	8f05e70340	Simplify mask checking in loop filters Considering a horizontal edge, if mask_16x16 is 1 for an even- indexed 8x8 block, then mask_16x16 is 1 for next 8x8 block in same row. Similiar to a verticle edge, if mask_16x16 is 1 for an even-rowed 8x8 block, then mask_16x16 is 1 for the 8x8 block right below it in next raw. Based on that, the mask_16x16 checking can be simplified to save cycles. The corresponding 8-pixel vp9_mb_lpf_horizontal_edge code can also be removed. Change-Id: Ic3fe7a5674322239208cbe2731dc3216ce2084f3	2013-11-27 14:10:57 -08:00
Dmitry Kovalev	d83d61d942	Moving reaster_block_offset{,_int16} from vp9_blockd.h to vp9_rdopt.h. Change-Id: I5a5888d4639cc6b7eb266be47581dd15ba08c91e	2013-11-27 12:57:21 -08:00
Dmitry Kovalev	f9da823216	Moving token-encoding related stuff from common to encoder. Change-Id: I0e59d320407b3bed0ba3622a7b29975f6fad7ebf	2013-11-27 11:27:57 -08:00
Dmitry Kovalev	e2f1d02eb3	Merge "Moving mode encodings from common to encoder + cleanup."	2013-11-27 11:00:54 -08:00
Yaowu Xu	e9c19617bf	Merge "vp9_short_fdct32x32_rd vp9_short_fdct32x32 optimized for AVX2"	2013-11-27 10:27:32 -08:00
Dmitry Kovalev	d3a2e55af4	Removing qcoeff buffers from the decoder. We only need qcoeff buffers in the encoder. Reducing TileWorkerData struct and VP9Decompressor struct sizes by 24K. Change-Id: Id148868461f7ffa3d3dd634b371503ae9c57e207	2013-11-26 18:52:10 -08:00
Dmitry Kovalev	fc3c3303f1	Removing dummy assignments. Change-Id: I10d1a4bcac751a982d9dd135f019e3a4d92f8522	2013-11-26 15:35:11 -08:00
Dmitry Kovalev	f4bf712fbb	Moving mode encodings from common to encoder + cleanup. Change-Id: I248ccb1532e2cd95314d0b95108f2c2e71cf084f	2013-11-26 14:53:17 -08:00
Yaowu Xu	b60293e1ce	Merge "Amended some comments for clarity"	2013-11-26 14:32:02 -08:00
Frank Galligan	b4874e2c82	Fix 16 wide neon horz loopfilter. Multiply by 3 was on 8bit vectors when it should have been on 16bit vectors. Change-Id: I248c1429b3134dfd171dfab0ebb109fd2437e1fc	2013-11-26 10:02:40 -08:00
Yunqing Wang	7a5fd6a1bf	Merge "Do vertical loopfiltering in parallel"	2013-11-26 09:35:14 -08:00
Abo Talib Mahfoodh	f97d91ab67	improve vp9_idct32x32_34(x1.472)&1024(x1.032)_add_sse2 vp9_idct32x32_34_add_sse2: speedup: 1.472 IDCT32_1D_34 and MULTIPLICATION_AND_ADD_2 are optimized based on the fact that Only upper-left 8x8 has non-zero values. vp9_idct32x32_1024_add_sse2: speedup: 1.032 Tested with: park_joy_420_720p50.y4m Change-Id: I8670ce547552b48695049de298e2fc46ce28dfbc	2013-11-26 12:28:26 -05:00
Dmitry Kovalev	5488da280d	Merge "Moving mv entropy encodings calculation to the encoder side."	2013-11-25 19:15:21 -08:00
Dmitry Kovalev	56d048c412	Moving mv entropy encodings calculation to the encoder side. Moved arrays: vp9_mv_joint_encodings vp9_mv_class_encodings vp9_mv_class0_encodings vp9_mv_fp_encodings Change-Id: Iaf5008c579fcbd6d77fdd81d1aef8c71b5f308b7	2013-11-25 16:36:28 -08:00
Dmitry Kovalev	7ba7a5f817	Merge "Removing redundant call of vp9_init_mbmode_probs()."	2013-11-25 16:08:42 -08:00
Dmitry Kovalev	cfc1f91c9f	Merge "Moving {left, right}_block_mode to vp9_blockd.h."	2013-11-25 10:59:24 -08:00
Dmitry Kovalev	e8af3db88a	Merge "Renaming COMPPREDMODE_TYPE enum and its members."	2013-11-25 10:59:08 -08:00
Yaowu Xu	dd69337e6e	Amended some comments for clarity Change-Id: I31c3908ba394095deb5d3a5d7b7c9b2b5328c3e8	2013-11-25 10:55:01 -08:00
Yaowu Xu	cc1e05ca5f	Merge "In frame Q adjustment experiment."	2013-11-25 10:52:22 -08:00
Jingning Han	f547fb8e07	Merge "Use separate inter predictors for enc/dec"	2013-11-25 10:29:07 -08:00
Paul Wilkins	644bd87e8e	In frame Q adjustment experiment. The idea here is to allow "in frame" adjustment of the final Q value used to encode each SB64, using segmentation. There is also adjustment of the rd mult in regions of overspend. Activated using aq_mode=2 Change-Id: I2f140cd898c9f877c32cd6d2e667f5e11ada4b1c	2013-11-25 10:22:55 -08:00
Yaowu Xu	3183135dd3	Merge "Fix a build issue with visual c."	2013-11-25 10:20:53 -08:00
Jingning Han	ba8b5e8d6d	Use separate inter predictors for enc/dec The decoder will construct inter predictor using lazy border extension, while the encoder, going with multiple runs of motion search in the rate- distortion optimization loop for each block, does border extension at frame level. This commit makes separate the inter predictors for encoder and decoder, respectively. Change-Id: Ieca2fecba3a7201a6d64ef9f219e5d91e50559c3	2013-11-25 09:43:34 -08:00
Jingning Han	12e5ec6aa8	Merge "Separate setup_scale_factor/extend_frame_borders"	2013-11-25 09:14:46 -08:00
Yaowu Xu	86368faca9	Fix a build issue with visual c. Change-Id: Ic8fc16ee1734cfde0d12a2e3abb3e9299382f3b1	2013-11-25 08:11:35 -08:00
Dmitry Kovalev	9fe88870c5	Merge "Cleaning up vp9_append_sub8x8_mvs_for_idx."	2013-11-24 16:08:20 -08:00
Dmitry Kovalev	52b43a2876	Inlining and removing vp9_set_pred_flag_seg_id() function. Change-Id: I0fd76937e847f78378a7ab3fa0af00a7c2c52b42	2013-11-22 17:32:11 -08:00
Dmitry Kovalev	fb9c19c62d	Renaming COMPPREDMODE_TYPE enum and its members. List of renames: COMPPREDMODE_TYPE => REFERENCE_MODE SINGLE_PREDICTION_ONLY => SINGLE_REFERENCE COMP_PREDICTION_ONLY => COMPOUND_REFERENCE HYBRID_PREDICTION => REFERENCE_MODE_SELECT (like TX_MODE_SELECT) NB_PREDICTION_TYPES => REFERENCE_MODES Change-Id: If723dabe9435325d0165dcd028142a2c78b417b4	2013-11-22 16:35:37 -08:00
Dmitry Kovalev	350731e8f9	Organizing all scan tables into lookup table. Change-Id: Ie829ee58a55157e6972c63cebe69a5d0a3221349	2013-11-22 16:20:45 -08:00
Dmitry Kovalev	52fa10a9a3	Cleaning up vp9_append_sub8x8_mvs_for_idx. Change-Id: Ic92f15d82ff5cfa3df655d08e460335c2ef8a325	2013-11-22 15:28:32 -08:00
Jingning Han	86d2a9b978	Separate setup_scale_factor/extend_frame_borders This commit takes out vp9_extend_frame_borders from vp9_setup_scale_factors. The refactoring is for the preparation of the use of lazy border extension at decoder. This makes it necessary to handle border extension separately at encoder/decoder. The use of vp9_extend_frame_borders will be removed, when lazy border extension is ready. Change-Id: Ia3baba3d179d5f11eee1634f19b3b319d2a59186	2013-11-22 12:02:08 -08:00
Dmitry Kovalev	e0ec61187e	Merge "Removing txfrm_block_to_raster_xy() call from extend_for_intra()."	2013-11-22 10:51:38 -08:00
Yunqing Wang	ed36720b66	Do vertical loopfiltering in parallel This patch followed "Add filter_selectively_vert_row2 to enable parallel loopfiltering" commit, and added x86 SSE2 optimization to do 16-pixel filtering in parallel. For other optimizations (neon and dspr2), current 16-pixel functions were done by calling 8-pixel functions twice, and real 16-pixel functions could be added later. Decoder speedup: tulip clip: 2% speed gain; old_town_cross: 1.2% speed gain; bus: 2% speed gain. Change-Id: I4818a0c72f84b34f5fe678e496cf4a10238574b7	2013-11-22 10:04:51 -08:00
Dmitry Kovalev	7c8cac3c21	Removing txfrm_block_to_raster_xy() call from extend_for_intra(). Change-Id: I6a48d1f35ed5fe7a2c7499675b339994c9c3bdf2	2013-11-21 19:30:58 -08:00
Dmitry Kovalev	ad3333e2cd	Merge "Removing plane_block_{width, height} functions."	2013-11-21 16:37:27 -08:00
levytamar82	8def766de2	vp9_short_fdct32x32_rd vp9_short_fdct32x32 optimized for AVX2 Change-Id: I6366e84490883b72362f762369d7e5bccb64f02f	2013-11-21 14:19:49 -08:00
Frank Galligan	97d1258375	Revert "Add 16 wide neon horz loopfilter." The change caused mismatches with some test vectors on neon. Original CL: https://gerrit.chromium.org/gerrit/#/c/67863/ Change-Id: I913891636d53783e93cb1865ca78ded1821dc4b0	2013-11-21 14:01:33 -08:00
Dmitry Kovalev	4896d5c7ef	Moving {left, right}_block_mode to vp9_blockd.h. Both functions have no relation to motion vectors, so moving them from vp9_findnearmv.h to vp9_blockd.h. Change-Id: I74f524267886ab0fff4a2da793a10c906ed0f43a	2013-11-21 11:43:53 -08:00
Yunqing Wang	e002bb99a8	Merge "Add filter_selectively_vert_row2 to enable parallel loopfiltering"	2013-11-21 11:25:55 -08:00
hkuang	370bf116a2	Merge "Remove unnecessary eob checking."	2013-11-21 11:24:02 -08:00
Frank Galligan	2dd77580c0	Merge "Add 16 wide neon horz loopfilter."	2013-11-21 10:29:30 -08:00
Yunqing Wang	b5e6d6cccf	Add filter_selectively_vert_row2 to enable parallel loopfiltering Added filter_selectively_vert_row2 to be ready for parallel loopfiltering in vertical direction. This change did 2-row filtering at a time. If 2 vertically adjacent 8x8 blocks do same type of filtering, we can do 16-pixel filtering in parallel. Next, we need to provide 16-pixel loopfiltering functions in c and optimized versions for codec speedup. Change-Id: Idf97bbdd70566e55bd30e1fd25cb8544e33291be	2013-11-21 09:53:15 -08:00
Yunqing Wang	6c4964602a	Merge "Correct ssse3 8/16-pixel wide sub-pixel filter calculation"	2013-11-21 09:40:02 -08:00
Frank Galligan	98de15137e	Add 16 wide neon horz loopfilter. Add support to do 16 pixel horizontal filtering in Neon. Nexus devices saw about 0.5% decode speed increase. Change-Id: I2993f6c2d49f31fa74976879eeaa289fd3f4e15d	2013-11-21 09:39:36 -08:00
Dmitry Kovalev	c90b6bb101	Removing redundant call of vp9_init_mbmode_probs(). This function is called from vp9_setup_past_independence() which is called before the modified piece of code. Moving reset of inter_mode_probs into vp9_init_mbmode_probs() for consistency. Change-Id: Ib188e8798e1fbe15407fd501406761b746fdda95	2013-11-20 21:56:38 -08:00
Dmitry Kovalev	a218a96784	Merge "Adding MV_FP_SIZE constant."	2013-11-20 14:39:58 -08:00
Yunqing Wang	256cf7ee7d	Correct ssse3 8/16-pixel wide sub-pixel filter calculation Although no mismatch was indicated for 8/16 wide sub-pixel filters in issue 661, they had similar problems that could cause mismatch potentially. This patch fixed calculations in HORIZx8/16 and VERTx8/16. Change-Id: I169961c9d40a20340995b7d22aafc89ccf30bfca	2013-11-20 12:52:56 -08:00
Dmitry Kovalev	79b5a2b142	Removing plane_block_{width, height} functions. Change-Id: I29c0dfcf41a1253d5e2a0d2ff740c0c38ebaa5a2	2013-11-20 12:39:29 -08:00
Jim Bankoski	302c33e49f	Merge "Clean up removal of vp9_pareto8 table."	2013-11-20 12:30:03 -08:00
Dmitry Kovalev	4956fcd31b	Adding MV_FP_SIZE constant. Change-Id: I98d750ee92ff51fb714980418ea28be3b1d0f3c6	2013-11-20 12:07:57 -08:00
hkuang	6debc446e0	Remove unnecessary eob checking. Change-Id: Ia568f70bddc1a2b62141a0197459119ca74c22b5	2013-11-20 11:58:11 -08:00
Jim Bankoski	25aae73a30	Merge "remove the model and copy in pack_mb_tokens"	2013-11-20 11:34:30 -08:00
Jim Bankoski	5bbb0c6295	Clean up removal of vp9_pareto8 table. Change-Id: I5556e8d1fc150be8a3e93af21900829b59a500dc	2013-11-20 11:17:26 -08:00
Jingning Han	81b9fd4310	Merge "Take out assertion from inverse transforms"	2013-11-20 10:55:27 -08:00
Jim Bankoski	03276bf6e6	remove the model and copy in pack_mb_tokens Change-Id: I00a5203c8ed76c184d936fccf93d76e7c06773d3	2013-11-20 10:06:04 -08:00
Yunqing Wang	0ef63f596d	Fix stack pointer in sub-pixel filters In commit "3d50da5397d20abc932d81453b26cde758293a40", the stack pointer was modified while aligning the stack, and it needed to be pop out at the end. Change-Id: I062971e195f1f2ab9d0ab5fb84dcf215a0fcaa67	2013-11-20 09:42:44 -08:00
Guillaume Martres	b00057c88a	Merge "vpxenc: add --aq-mode flag to control adaptive quantization"	2013-11-20 08:13:28 -08:00
Jim Bankoski	7a8a68e2bd	Merge "scan order table lookup same for encoder and decoder"	2013-11-19 16:22:48 -08:00
Yunqing Wang	e8f8e77642	Merge "Fix decoder mismatch with ssse3 enabled"	2013-11-19 16:19:32 -08:00
Yaowu Xu	dd04ff506b	Merge "Move vp9_setup_interp_filter() to encoder"	2013-11-19 16:01:19 -08:00
Jim Bankoski	d6667dd54f	scan order table lookup same for encoder and decoder Change-Id: I473947b5ca70b7a81151926284bff86f8555492a	2013-11-19 15:31:43 -08:00
Yunqing Wang	3d50da5397	Fix decoder mismatch with ssse3 enabled This patch fixed issue 661: "Decoder produces mismatched outputs with ssse3 enabled and disabled." In sub-pixel filters, a pixel value was multiplied by a filter coefficient, and the results were added up. The order of adding up these multiplications had to be arranged carefully to prevent incorrect overflowing. Change-Id: Id08af4200fea9e1b896fc40157b8651c2c7e80f2	2013-11-19 15:10:04 -08:00
Dmitry Kovalev	65cee2f01a	Merge "Simplifying partition context calculation."	2013-11-19 15:09:01 -08:00
Jim Bankoski	60aba6558f	Merge "entropy code speedup"	2013-11-19 14:58:44 -08:00
Yaowu Xu	df78fea166	Move vp9_setup_interp_filter() to encoder As it is used in encoder only. Change-Id: I5f2a8abbe72bb18cbf6ce36a3dc7e132aeae8ec2	2013-11-19 14:57:58 -08:00
Yaowu Xu	f92cfa1ca6	Merge "Move vp9_sadmxn.h from common to encoder"	2013-11-19 14:41:33 -08:00
Jim Bankoski	8cf352abac	entropy code speedup Change-Id: Ic316d3374ff9a2b43897272260947d56765a0fdd	2013-11-19 14:31:38 -08:00
Jim Bankoski	ff4f1c4b76	scan order / neighbors converted to lookup Change-Id: I64b189dfeee1cf3e90134a1a93497072f3361e5e	2013-11-19 12:55:44 -08:00
Yaowu Xu	30b03050a2	Move vp9_sadmxn.h from common to encoder Change-Id: I6f6ba91b1b8b280902b171472314d665aa0baf0b	2013-11-19 12:46:08 -08:00
Dmitry Kovalev	f6ec323906	Simplifying partition context calculation. Reversing bit order of partition_context_lookup, and modifying accordingly update_partition_context() and partition_plane_context(). Change-Id: I64a11f1a94962a3bf217de2f50698cb781db71a5	2013-11-19 11:17:30 -08:00
Yunqing Wang	f16fb829e6	Merge "Improve vp9_iht4x4_16_add_sse2 (x1.341)"	2013-11-19 11:11:47 -08:00
Dmitry Kovalev	953b1e9683	Removing raster_block_offset_uint8() function. There is no need to use that function, it is much clear to pass offset directly to the buffer. Change-Id: I9026cb0c5094c46f97df5d7f7daeb952f2843b24	2013-11-18 19:00:49 -08:00
Dmitry Kovalev	9e1e7bee48	Merge "Finally removing txfrm_block_to_raster_block() function."	2013-11-18 18:43:16 -08:00
Dmitry Kovalev	220af9ac2c	Merge "Cleaning up vp9_entropy.c file."	2013-11-18 18:04:56 -08:00
Abo Talib Mahfoodh	613e2d2e90	Improve vp9_iht4x4_16_add_sse2 (x1.341) This rebase is a better implementation of the previous ones. Modifications are done to reduce the total clock cycle. Speedup: 1.341 Compiled with -O3 Tested with: park_joy_420_720p50.y4m Change-Id: I940eaf283f60597ca0d9d2e13d518878d55ff02d	2013-11-18 20:53:13 -05:00
Dmitry Kovalev	d8c06d23da	Cleaning up vp9_entropy.c file. Change-Id: I568f5e2d4ef2f2affe013ba1691ffb546f1fe8c6	2013-11-18 17:18:14 -08:00
Yaowu Xu	a42ab027fd	Merge "Move vp9_extend.{h,c} from common to encoder"	2013-11-18 15:43:32 -08:00
Yaowu Xu	1c61e1960d	Move vp9_extend.{h,c} from common to encoder Since they used in encoder only. This commit also re-order includes for the files that include vp9_extend.h Change-Id: I929fc113f2135d3198cd1fc6a17434e5a2f8a459	2013-11-18 12:43:36 -08:00
Yunqing Wang	e3168b0c54	Merge "Do horizontal loopfiltering in parallel"	2013-11-18 10:03:41 -08:00
Jim Bankoski	83eb1975df	partition context update speedup This removes a lot of operations in setting partition context... Change-Id: I365e6f5607ece85190cb21443988816dfa510ce3	2013-11-17 06:58:08 -08:00
Yunqing Wang	64f728caef	Do horizontal loopfiltering in parallel This patch followed "Rewrite filter_selectively_horiz for parallel loopfiltering" commit, and added x86 SSE2 optimization to do 16-pixel filtering in parallel. Also, corrected the declaration of aligned arrays. For 8-pixel-in-parallel case, improved the calculation of the masks and filters. Updated the threshold loading since the thresholds were already duplicated. Updated neon C functions to call neon loopfilters twice. Using tulip clip, tests showed it gave a ~1.5% decoder speed gain. Change-Id: Id02638626ac27a4b0e0b09d71792a24c0499bd35	2013-11-15 16:18:43 -08:00
Jingning Han	bdc4371174	Take out assertion from inverse transforms Separate the rounding and right shift operations of forward transform from those of inverse transform. Take out the assertion check from inverse transforms. If the transform coefficients were constructed to cause intermediate steps of inverse transform overflow, the codec will just let it overflow without breaking the decoding flow. Change-Id: I73cfc3706c4e840fc543a77cbc4cdb0b05d07730	2013-11-15 15:30:47 -08:00
hkuang	7424492a0b	Let the idct vp9_idct32x32_34_add = vp9_idct32x32_1024_add on arm until we implenment real vp9_idct32x32_34_add_neon. This issue is due to commit `47665452f0` Merge "Add 32x32 idct function for eob<=34 case". Change-Id: I56b5f0abc20e7dd1bba521f78a995e85d65ea296	2013-11-15 14:59:16 -08:00
Guillaume Martres	17084657e6	vpxenc: add --aq-mode flag to control adaptive quantization Change-Id: I57e1ad4bed3487df12893ced77c49093f8755706	2013-11-15 19:42:20 +01:00
Dmitry Kovalev	8d7bd4d126	Merge "Cleaning up vp9_loopfilter.c file."	2013-11-15 10:10:59 -08:00
Jingning Han	a9b9f22bcd	Merge "Fix coding format in vp9_idct"	2013-11-15 08:59:14 -08:00
Jim Bankoski	e1b6c42eed	partition plane context speed up Removes silly operations inside loop. Change-Id: I9eeab1e914e715a887f86cf1089de508e2364165	2013-11-15 08:00:43 -08:00
Jim Bankoski	ffb17e2c09	Merge "loop filter assert cleanout"	2013-11-15 07:48:36 -08:00
Dmitry Kovalev	38e6cb8c7b	Merge "Cleaning up vp9_tile_common.{h, c} files."	2013-11-14 20:55:01 -08:00
Jingning Han	7637387cf1	Fix coding format in vp9_idct Change-Id: If97ae16a4478717933345b6b9d5bc1b417b8dd84	2013-11-14 16:05:22 -08:00
Adrian Grange	38144ed8b2	fix scalling bug by buffer auto-reallocation Change-Id: Ib748eb287520c794631697204da6ebe19523ce95	2013-11-14 15:53:09 -08:00
Dmitry Kovalev	3f9fc6f6f8	Cleaning up vp9_loopfilter.c file. Change-Id: Ic6770072f80dfb54d2725ed96370d4f243a9f474	2013-11-14 15:04:14 -08:00
Dmitry Kovalev	49fbbf72fa	Finally removing txfrm_block_to_raster_block() function. We only use txfrm_block_to_raster_xy() now. Change-Id: I4242cd592da99e761041acf9fef1bac3d55a48e1	2013-11-14 13:45:51 -08:00
Dmitry Kovalev	f91ac9b436	Cleaning up vp9_tile_common.{h, c} files. Change-Id: I9d18f351abe7614107f34f47eeb38a234a9937c9	2013-11-14 13:40:56 -08:00
Jim Bankoski	ef99b7b884	loop filter assert cleanout Change-Id: I4e2ad4b7342681e6ac236356ef3a4927a54f105b	2013-11-14 12:25:32 -08:00
Deb Mukherjee	cfcd5c4f61	Simplifies band-getting with a static array Simplifies the code by implementing band mapping with static arrays. A lot of the code complexity introduced in a previous patch disappears. Change-Id: Ia3fac36e594fb5ad2d55ae141c58bba4c55c2d28	2013-11-13 22:15:16 -08:00
Dmitry Kovalev	26a1ad604f	Merge "Removing function pointers from inter prediction."	2013-11-13 13:54:15 -08:00
Dmitry Kovalev	60d1a52995	Merge "Optimizing set_contexts() function."	2013-11-13 10:01:05 -08:00
Yunqing Wang	8ce0967df8	Merge "Use 1D array to store super block filter levels"	2013-11-13 09:40:14 -08:00
Johann	4da2a8b718	Merge "mips dsp-ase r2 vp9 decoder intra module optimizations (rebase)"	2013-11-13 09:00:09 -08:00
Parag Salasakar	1530a6b77f	mips dsp-ase r2 vp9 decoder intra module optimizations (rebase) Change-Id: Ib27fc4f3dbe01fe8adfa04a61aaba21b3480e75c	2013-11-13 11:17:14 +05:30
Parag Salasakar	248cf6f69f	mips dsp-ase r2 vp9 decoder loopfilter module optimizations (rebase) Change-Id: Ia7f640ca395e8deaac5986f19d11ab18d85eec2d	2013-11-13 10:53:16 +05:30
Dmitry Kovalev	3f3d14e1d3	Moving q_index from MACROBLOCKD to MACROBLOCK. Moving because q_index is used only by encoder. Change-Id: I0b96175614ed4fd3d76ee56a0ba36258e1e896f6	2013-11-12 18:13:19 -08:00
Dmitry Kovalev	73a5cbeba4	Merge "Using max_tx_size instead of bsize when possible."	2013-11-12 16:54:30 -08:00
Dmitry Kovalev	3a2ea76469	Merge "Moving {sb, mb, b, ab}_index from MACROBLOCKD to MACROBLOCK."	2013-11-12 15:59:28 -08:00
Dmitry Kovalev	58b004ff64	Merge "Adding const to tree pointer inside vp9_extra_bit struct."	2013-11-12 15:48:07 -08:00
Johann	8dd3905163	Merge "Added optimized vp9_idct32x32_34_add_dspr2"	2013-11-12 15:30:00 -08:00
Dmitry Kovalev	20f34ff0db	Adding const to tree pointer inside vp9_extra_bit struct. Change-Id: I60e02fa3de930ff1f969687ab5af93dee40d86ad	2013-11-12 14:21:15 -08:00
Yunqing Wang	ce89309b45	Use 1D array to store super block filter levels As Jim suggested, 1D array was used to store filter levels instead of 2D array. This used shift_y in setup_mask directly, and saved few cycles. Change-Id: If61ab298784861f1806b1cd396d4e4e2e0f097b9	2013-11-12 12:07:57 -08:00
Deb Mukherjee	a33a84b11a	Merge "Removes conditional statements from band getting"	2013-11-12 11:22:21 -08:00
Johann	e72d49a97a	Use lowercase 'b' to branch iOS doesn't recognize B: bad instruction `B idct32_pass_loop' Change-Id: I3cf6aede4639f1d9efa97f7962fa287ba6feaaef	2013-11-12 10:41:06 -08:00
Yunqing Wang	17322275dd	Merge "Rewrite filter_selectively_horiz for parallel loopfiltering"	2013-11-12 10:20:49 -08:00
Yunqing Wang	7989768766	Merge "Improve loopfilter function"	2013-11-12 10:19:56 -08:00
Deb Mukherjee	5ade423774	Removes conditional statements from band getting Implements scan order to band map with arrays in both the encoder and decoder to remove conditional statements. Encoding seems to be about 1% faster at speed 0, tested on football. Decoding seems to be about 0.5-1% faster on a set of 25 videos. Change-Id: Idb233ca0b9e0efd790e30880642e8717e1c5c8dd	2013-11-12 10:13:27 -08:00
Dmitry Kovalev	50f97cf7fb	Removing function pointers from inter prediction. Removing foreach_predicted_block_visitor and calling build_inter_predictors directly. Change-Id: I11bb3c872b99b47c2680b01b0dbcc01c558c4a2b	2013-11-11 18:37:00 -08:00
Yunqing Wang	b45438181c	Rewrite filter_selectively_horiz for parallel loopfiltering Added loop filter mask checking, and made the caller function ready for implementation of parallel loopfiltering in horizontal direction. Next, we need to go through the loopfilter functions (both c and optimized versions), and provide 16-byte wide loopfiltering for each filter type. Change-Id: Ifef47e7ef9086ebc2fd6ca7ede8f27c9bbf79e66	2013-11-11 17:06:01 -08:00
Dmitry Kovalev	3551e25099	Moving {sb, mb, b, ab}_index from MACROBLOCKD to MACROBLOCK. We use {sb, mb, b, ab}_index only inside encoder, so moving them into appropriate data structure. Change-Id: Ib5c1036716354d9d321e11a60c1634c1cb8f9716	2013-11-11 15:58:57 -08:00
Jingning Han	d8b4c79270	Decouple macroblockd_plane buffer usage Make the macroblockd_plane contain dynamic buffer pointers instead static pointers to the memory space allocated therein. The decoder uses the buffer allocated in pbi, while encoder will use a dual buffer approach for rate-distortion optimization search. Change-Id: Ie6f24be2dcda35df7c15b4014e5ccf236fb3f76c	2013-11-11 15:26:10 -08:00
hkuang	c689a126ed	Fix a bug in the assembly code. Change-Id: Ic416e3f8a11e82ee298e6f709b2119a9ddf1e2f8	2013-11-11 12:49:12 -08:00
Dmitry Kovalev	c53a9c70fb	Merge "Localizing NEARESTMV special cases in the code."	2013-11-11 11:12:06 -08:00
Dmitry Kovalev	22a001988b	Optimizing set_contexts() function. Inlining set_contexts_on_border() into set_contexts(). The only difference is the additional check that "has_eob != 0" in addition to "xd->mb_to_right_edge < 0" and "xd->mb_to_right_edge < 0". If has_eob == 0 then memset does the right thing and works faster. Change-Id: I5206f767d729f758b14c667592b7034df4837d0e	2013-11-08 12:44:56 -08:00
Yunqing Wang	e731b2ba2c	Merge "Improve vp9_idct4x4_1_add_sse2"	2013-11-08 12:00:36 -08:00
Yunqing Wang	49cf335e7f	Improve loopfilter function This patch continued the work done in "Rewrite loop_filter_info_n struct"(commit:00dbd369c70270428d56da6d15ea5486fc821c52) to further improve loopfilter function. 1. Instead of storing pointers to thresholds, store loopfilter levels within 64x64 SB; 2. Since loopfilter levels are already calculated in setup_mask, we don't need call build_lfi to look up them again. Just save loopfilter levels in setup_mask. 3. Reorganized and simplified filter_block_plane(). Tests showed a ~0.8% decoder speedup. Change-Id: I723c7779738bbc2afcb9afa2c6f78580ee6c3af7	2013-11-08 11:48:31 -08:00
hkuang	a6462990e6	Merge "Add back vp9_short_idct32x32_1_add_neon which is deleted in cleanup I63df79a13cf62aa2c9360a7a26933c100f9ebda3."	2013-11-07 14:42:29 -08:00
Ivan Maltz	741c14fcf0	Merge "Move SVC per-frame loop from sample app into libvpx proper"	2013-11-06 17:24:05 -08:00
Ivan Maltz	1ed0e1beb5	Move SVC per-frame loop from sample app into libvpx proper SVC multiple layer per frame encoding is invoked with vpx_svc_init and vpx_svc_encode. These interfaces are designed to be invoked from ffmpeg. Additional improvements: - make dummy frame handling a bit more explicit - fixed bug with single layer encodes - track individual frame sizes and psnrs instead of averages - parameterized quantizer, 16th scalefactors, more logging, - enabled single layer encodes to generate baseline - include new mode for 3 layer I frame with 5 total layers Change-Id: I46cfa600d102e208c6af8acd6132e0cc25cda8d4	2013-11-06 14:49:27 -08:00
Dmitry Kovalev	7b011c5467	Replacing mi_{width,height}_log2 with num_8x8_blocks_{wide,high}_lookup. Change-Id: I04c55daef89bca2b85cb7db0850f9b052abc5a7c	2013-11-06 13:34:23 -08:00
Yaowu Xu	2f4bade348	Merge "Missing _ means no sse3 for vp9_h_predictor_32x32."	2013-11-06 13:04:28 -08:00
Paul Wilkins	0c39318a8b	Missing _ means no sse3 for vp9_h_predictor_32x32. Error in script means vp9_h_predictor_32x32 sse3 version is not enabled. Change-Id: Ia43672740da1ecdfb7fcd420490ef424b04accc4	2013-11-06 13:57:55 +00:00
Dmitry Kovalev	4a96e64dc2	Using max_tx_size instead of bsize when possible. Change-Id: I246364bc4270ca13aefb4bc3445bcf102b3170dc	2013-11-05 17:36:43 -08:00
hkuang	6b16f63332	Add back vp9_short_idct32x32_1_add_neon which is deleted in cleanup I63df79a13cf62aa2c9360a7a26933c100f9ebda3. Change-Id: I034848cf05031618818f7df2e7f9c35102686948	2013-11-05 14:57:32 -08:00
Dmitry Kovalev	815189613b	Localizing NEARESTMV special cases in the code. Removing special case handling from vp9_tree_probs_from_distribution(), tree_merge_probs(), and vp9_tokens_from_tree_offset() functions. Replacing inter_mode_offset() function with macro INTER_OFFSET which is used now for vp9_inter_mode_tree definition. Change-Id: Iff75a1499d460beb949ece543389c8754deaf178	2013-11-05 11:58:57 -08:00
Dmitry Kovalev	c622e1d18f	Unified approach for backward probability update. Replacing update_mode_probs() and adapt_probs() with tree_merge_probs(). Change-Id: I50b2c968d67c9265f5216c700cbeba25fb014654	2013-11-04 16:12:29 -08:00
Dmitry Kovalev	dde8069e57	Splitting partition_probs array into two arrays. We only update partition_probs for inter frames but they are constant for key frames. It is not necessary to have constants inside frame context and copy them every time. This change reduces FRAME_CONTEXT size by at least 48 bytes. Change-Id: If70a53be51043f37fe7d113853217937710932a7	2013-11-04 14:26:16 -08:00
Dmitry Kovalev	dd209fae3a	Merge "Removing 'new' probability calculation from convert_distribution()."	2013-11-04 11:14:58 -08:00
James Zern	152181b25c	Merge "vp9 ssse3 d207_predictor_32x32: add missing GLOBAL()"	2013-11-02 12:25:47 -07:00
James Zern	2d980b803a	vp9 ssse3 d207_predictor_32x32: add missing GLOBAL() removes a textrel for sh_b23456789abcdefff Change-Id: I80cb9dfd8e49a0fe884c8ff76472275b3a00cb57	2013-11-01 20:33:22 -07:00
Dmitry Kovalev	df19c6b64c	Removing 'new' probability calculation from convert_distribution(). We don't have to calculate 'new' probability in convert_distribution() because it is enough to calculate only 'new' counters which could be used to calculate probability if necessary. That's why removing a lot of unused temporary probability arrays and reducing number of get_binary_prob() calls. Change-Id: I4e14eb7203d1ace61bbddefd6b9b6326be83ba63	2013-11-01 15:09:43 -07:00
Yaowu Xu	333345cd26	Merge "Convert filter kernel choice to lookup"	2013-11-01 13:43:09 -07:00
Yaowu Xu	0f76ba5523	Convert filter kernel choice to lookup Also removed unused declaration related 6 tap filter Change-Id: Ic17f516141d885157918505f4204081e4c951fad	2013-11-01 13:03:18 -07:00
Dmitry Kovalev	340b2b076e	Merge "Cleanup. Adding const to function pointer arguments."	2013-11-01 10:57:03 -07:00
Dmitry Kovalev	0e1756330b	Merge "Removing is_intra_mode() function."	2013-10-31 18:06:53 -07:00
Dmitry Kovalev	7c524bbef4	Cleanup. Adding const to function pointer arguments. Change-Id: I12c67c8c0fa1aa7fb3f7d6cc2ef65be29c4ea292	2013-10-31 14:34:21 -07:00
Yaowu Xu	d515716140	Merge "mb_lpf_horizontal_edge AVX2 optimization"	2013-10-31 10:43:57 -07:00
Yunqing Wang	d03b3cbdd7	Merge "Fix x_offset_q4/y_offset_q4 calculation"	2013-10-31 09:47:54 -07:00
Tamar Levy	54f9205653	mb_lpf_horizontal_edge AVX2 optimization This CL contains two AVX2 optimized loop filter functions, mb_lpf_horizontal_edge_w_avx2_8 and mb_lpf_horizontal_edge_w_avx2_16. Change-Id: I604e4fe6e99752b7800c2ea98721d97f7e0b931b	2013-10-31 10:26:15 -06:00
Parag Salasakar	d5a52edc11	Added optimized vp9_idct32x32_34_add_dspr2 Change-Id: I2ba9467525b87a8e4a58f0c546e63031b4e38a4e	2013-10-31 12:12:34 +05:30
Dmitry Kovalev	6761872e49	Replacing (SWITCHABLE_FILTERS + 1) with SWITCHABLE_FILTER_CONTEXTS. Change-Id: I9781a62bc1a4cd9176554d1271d87dbcafda9cb0	2013-10-30 14:40:34 -07:00
Yunqing Wang	9ed2d0a577	Fix x_offset_q4/y_offset_q4 calculation "<< SUBPEL_BITS" needs to be added in the calculation. Call set_scaled_offsets() to calculate x_offset_q4 and y_offset_q4. Change-Id: Ied130ea771510e918f51cd1dc3abe57f4c0962b5	2013-10-29 17:46:55 -07:00
Dmitry Kovalev	1bea58e4a8	Merge "Adding const to vp9_quantize_b_{32x32,} parameters."	2013-10-29 16:57:52 -07:00
Erik Niemeyer	27b8040c76	Merge "CL for adding AVX-AVX2 support in libvpx."	2013-10-29 15:55:54 -07:00
Dmitry Kovalev	065972f959	Adding const to vp9_quantize_b_{32x32,} parameters. Change-Id: I56f8c50ac382202f66040cd9cfaa05d889572fc7	2013-10-29 15:25:19 -07:00
Erik Niemeyer	e6863ef318	CL for adding AVX-AVX2 support in libvpx. Change-Id: Idc03f3fca4bf2d0afd33631ea1d3caf8fc34ec29	2013-10-29 15:11:16 -07:00
Dmitry Kovalev	e5956258dd	Merge "Making get_tx_counts() similar to get_tx_probs()."	2013-10-29 10:48:50 -07:00
Yunqing Wang	c634ec6a56	Merge "Rewrite loop_filter_info_n struct"	2013-10-29 09:49:36 -07:00
Dmitry Kovalev	aa76cd1e49	Removing is_intra_mode() function. It is enough to check just block type: intra or inter. Intra block implies intra prediction mode, and inter block implies inter mode. Change-Id: I3cf98731a3935f670a3cd8e2b2443483eb944be4	2013-10-28 20:00:55 -07:00
Dmitry Kovalev	fa1ac00aee	Making get_tx_counts() similar to get_tx_probs(). Change-Id: I5b17f40e515c4bcf9ebef5380270a214af4e0115	2013-10-28 19:52:38 -07:00
Dmitry Kovalev	19cf72eddc	Adding {read, write}_partition() instead of check_bsize_coverage(). Making partition read/write logic more clear. Change-Id: I1981e90327257d37095567c62d72a103cda1da33	2013-10-28 15:14:45 -07:00
James Zern	58a0f6dbdd	vp9: add TileInfo replaces use of cur_tile_mi_(row\|col)_(start\|end) by VP9_COMMON, making it less stateful and more reusable for parallel tile decoding Change-Id: I1df09382b4567a0e5f4434825d47c79afe2399be	2013-10-28 20:54:43 +01:00
James Zern	3ffa41aae3	Merge changes If9b16f7d,I75aab21c,I9cbb768c,If5cea3d3,I96940657,I025595d8,Ie0bc3935,I3ebb172d * changes: vp9: remove partition+entropy contexts from common vp9: add above/left_context to MACROBLOCKD vp9: add above/left_seg_context to MACROBLOCKD vp9: add above/left_context to encoder vp9: add above/left_seg_context to encoder vp9: pass entropy context directly to set_skip_context vp9: pass context directly to partition functions vp9/decode: add alloc_tile_storage()	2013-10-28 12:45:11 -07:00
Dmitry Kovalev	ded951793c	Merge "Replacing is_inter_mode with is_inter_block."	2013-10-28 10:07:06 -07:00
James Zern	7b9ca3caa7	vp9: remove partition+entropy contexts from common these are now handled separately by the encoder and decoder Change-Id: If9b16f7d734e992fb94a510a6d88f2690d7fb7cb	2013-10-28 11:34:20 +01:00
James Zern	e571d3badc	vp9: add above/left_context to MACROBLOCKD Change-Id: I75aab21c1692cbad717564cbb436578fddbc348d	2013-10-28 11:34:18 +01:00
James Zern	d9a317c8b2	vp9: add above/left_seg_context to MACROBLOCKD Change-Id: I9cbb768c5f857a096cf6c29d6755d0e5e6728435	2013-10-28 11:32:16 +01:00
Dmitry Kovalev	07502f1963	Merge "Adding get_frame_new_buffer() function to replace duplicated code."	2013-10-25 15:25:13 -07:00
Dmitry Kovalev	ddfc87c6f3	Merge "Making input pointer constant for all fdct/fht functions."	2013-10-25 15:14:49 -07:00
Yunqing Wang	00dbd369c7	Rewrite loop_filter_info_n struct Restructured the storing of loopfilter information. Deleted loop_filter_info struct and reduced copying happened in every superblock. Tests showed a 0.5% ~ 0.8% decoder speed gain. Change-Id: Ie6a8e46bae71dc3a3cd8c6054f5de540b8e0ef5e	2013-10-25 14:56:28 -07:00
James Zern	d2bf696ee0	vp9: pass entropy context directly to set_skip_context this will allow for separate storage to be used in tile decoding Change-Id: I025595d83118bdc82a545dae69bc6602e8d2a6e3	2013-10-25 22:01:13 +02:00
James Zern	88d79eabdc	vp9: pass context directly to partition functions update_partition_context / partition_plane_context: this will allow for separate storage to be used in tile decoding Change-Id: Ie0bc393531ab7e9d2ce35c95111849b294aad4ed	2013-10-25 22:01:13 +02:00
Dmitry Kovalev	d5ac877f7f	Adding COLOR_SPACE enum. Change-Id: If5711eb166609cce0a88b3cb5b56b3afeebc4fb0	2013-10-25 12:35:20 -07:00
Yunqing Wang	47665452f0	Merge "Add 32x32 idct function for eob<=34 case"	2013-10-25 09:34:46 -07:00
Yunqing Wang	f88315cb29	Add 32x32 idct function for eob<=34 case When only upper-left 8x8 area has non-zero dct coefficients, we could skip 1D IDCT for 9th to 32th rows to save operations. This function is called when eob <= 34. Change-Id: I9684b75947bdde346cfe3720f08a953aa7a13fb5	2013-10-24 16:13:21 -07:00
Johann	35c4437bf5	Merge "mips dsp-ase r2 vp9 decoder idct module optimizations (rebase)"	2013-10-24 15:49:31 -07:00
Dmitry Kovalev	237ce8724a	Adding get_frame_new_buffer() function to replace duplicated code. Change-Id: I6e0e19231a48364c1de7dfab730b121ab227f111	2013-10-24 12:20:35 -07:00
Dmitry Kovalev	600a3860a4	Making input pointer constant for all fdct/fht functions. Change-Id: I78f7012f967a777ddd39bae6671eb501df6bbfe8	2013-10-24 11:48:25 -07:00
Dmitry Kovalev	7bb48e5e8e	Replacing is_inter_mode with is_inter_block. It should be only a check based on the block type (inter vs intra), not on the mode value. Change-Id: I0378cb4ba7c9a1631c1e870a537187b8650fa30a	2013-10-24 11:22:06 -07:00
Dmitry Kovalev	dfc7945d1e	Adding get_frame_ref_buffer() function + cleanup. Change-Id: Ib9ead216fc54b2df6f6f1fe82d2ea137197beebd	2013-10-24 11:05:35 -07:00
Dmitry Kovalev	8001ed71ed	Merge "Renaming vp9_short_fdct4x4 and vp9_short_walsh4x4."	2013-10-24 10:08:42 -07:00

... 7 8 9 10 11 ...

2557 Commits